هلا تعلن عن وظيفة مهندس موثوقية الموقع في الرياض
تفاصيل الوظيفة
شركة هلا، إحدى الشركات الرائدة في مجال التكنولوجيا المالية في منطقة الشرق الأوسط وشمال أفريقيا وباكستان، تبحث عن مهندس موثوقية الموقع (Site Reliability Engineer) للانضمام إلى فريقها في الرياض، المملكة العربية السعودية.
المهام والمسؤوليات
- إدارة بيئة السحابة ومراقبة توفر النظام وصحته بشكل شامل.
- بناء برمجيات وأنظمة لإدارة البنية التحتية والتطبيقات.
- تحسين موثوقية وجودة وسرعة طرح حلول البرمجيات.
- قياس وتحسين أداء النظام لتلبية احتياجات العملاء والابتكار المستمر.
- تقديم الدعم التشغيلي والهندسي الأساسي لتطبيقات موزعة واسعة النطاق.
- جمع وتحليل مقاييس أنظمة التشغيل والتطبيقات للمساعدة في تحسين الأداء واكتشاف الأخطاء.
- التعاون مع فرق التطوير لتحسين الخدمات عبر إجراءات اختبار وإصدار صارمة.
- المشاركة في استشارات تصميم النظام وإدارة المنصة وتخطيط السعة.
- إنشاء أنظمة وخدمات مستدامة من خلال الأتمتة والتحسينات.
- الموازنة بين سرعة تطوير الميزات والموثوقية باستخدام أهداف مستوى الخدمة المحددة.
- نشر التحديثات والإصلاحات.
- بناء أدوات لتقليل حدوث الأخطاء وتحسين تجربة العملاء.
- إجراء تحليل السبب الجذري للأخطاء الإنتاجية.
- التحقيق في المشكلات التقنية وحلها.
- تصميم إجراءات استكشاف الأخطاء وإصلاحها وصيانة النظام.
الشروط والمتطلبات
- درجة البكالوريوس في علوم الحاسب، تقنية المعلومات أو مجال معادل (يمكن استبدالها بالخبرة العملية).
- خبرة لا تقل عن 3 سنوات في دور مماثل (مهندس موثوقية، DevOps، أو بنية تحتية).
- معرفة متقدمة بالامتثال واللوائح التنظيمية.
- خبرة في إدارة Kubernetes.
- خبرة في أدوات البنية التحتية ككود مثل Terraform و Ansible.
- خبرة مع أحد مزودي السحابة الرئيسيين: AWS, GCP, Azure, أو OCI.
- خبرة في تصميم وتطوير واستكشاف أخطاء الأنظمة واسعة النطاق.
- خبرة في بناء خطوط CI/CD (يفضل GitOps).
- خبرة في أدوات المراقبة والملاحظة مثل Prometheus, Loki, Jaeger, و Sentry.
- خبرة في إدارة قواعد البيانات (خطط النسخ الاحتياطي والاستعادة، النسخ المتماثل، والتجميع) مثل PostgreSQL و MongoDB.
- معرفة جيدة بالشبكات (يفضل خبرة مع VPNs و Service Mesh).
المهارات المطلوبة
- تحقيق الذات والإنجاز: مستوى متقدم.
- التآزر الجماعي والتطوير: مستوى متقدم.
- العقلية الريادية والدافعية: مستوى متقدم.
- الفطنة التجارية والاجتهاد: مستوى متقدم.
المزايا
- ثقافة شاملة ومتنوعة تشجع الابتكار والمرونة في العمل عن بُعد أو في المكتب أو الهجين.
- حزم تعويضات تنافسية للغاية، مع إمكانية الحصول على أسهم.
- أولوية للتطوير الشخصي مع تدريب منتظم ومخصص سنوي للتعلم.
- الانضمام إلى فريق موهوب يضم أكثر من 30 جنسية يعملون في 7 دول.
- الاستقلالية والتوجيه وأهداف طموحة تخلق فرصًا ممتازة للنمو.
- مسؤولية وثقة كبيرتان، مع حرية اتخاذ القرارات في مجال عملك.
عرض النص الأصلي للإعلان
Who Are We
HALA is a leading fintech player in the MENAP region that aims to redefine financial services and build the future bank of SMEs. HALA aims at empowering SMEs to start, run, and grow their businesses by providing them with cutting-edge financial and technological tools.
HALA currently holds multiple entities in UAE, Saudi Arabia and Egypt (including HALA Payments and HALA Logistics) and offers solutions that enable merchants to digitize their payments as well as manage their sales and operations.
Founded in 2017, HALA is currently licensed by the Saudi Arabian Central Bank.
Job Summary
The Site Reliability Engineer (SRE) is responsible for ensuring the reliability, availability, performance, and scalability of the organization's infrastructure and applications. The role focuses on automating operations, managing cloud and Kubernetes environments, maintaining CI/CD pipelines, monitoring system health, and resolving production issues. Working closely with development teams, the SRE helps build resilient, secure, and efficient platforms that support continuous delivery and business growth.
Tasks & Responsibilities:
- Run the cloud environment by monitoring availability and taking a holistic view of system health
- Build software and systems to manage platform infrastructure and applications
- Improve reliability, quality, and time-to-market of our suite of software solutions
- Measure and optimize system performance, with an eye toward pushing our capabilities forward, getting ahead of customer needs, and innovating to continually improve
- Provide primary operational support and engineering for multiple large, distributed software applications
- Gather and analyze metrics from both operating systems and applications to assist in performance tuning and fault finding
- Partner with development teams to improve services through rigorous testing and release procedures
- Participate in system design consulting, platform management, and capacity planning
- Create sustainable systems and services through automation and uplifts
- Balance feature development speed and reliability with well-defined service level objectives
- Deploy updates and fixes
- Build tools to reduce occurrences of errors and improve customer experience
- Perform root cause analysis for production errors
- Investigate and resolve technical issues
- Design procedures for system troubleshooting and maintenance
Requirements:
- Bachelor’s Degree in computer science, information technology, or equivalent field of studies.
- The education levels can be replaced by years of experience
- 3+ years of experience in a similar position (SRE, DevOps, or infrastructure engineer).
- Advanced knowledge of compliance and regulations
- Experience with Kubernetes administration.
- Experience with infrastructure as code tools such as Terraform and Ansible.
- Experience with at least one of the major cloud providers: AWS, GCP, Azure, or OCI.
- Experience with architecting, developing, and troubleshooting large-scale systems.
- Experience building CI/CD pipelines (preferably GitOps).
- Experience with monitoring and observability tools such as Prometheus, Loki, Jaeger, and Sentry.
- Experience in managing databases including (backup and restore plans, replication, and clustering) such as PostgresSQL, and MongoDB.
- Good networking knowledge (preferably experience with VPNs and Service Mesh)
Core Competencies:
- Self-Actualization & Fulfilment: Proficiency Level - ADVANCED
- Team Synergy & Development: Proficiency Level - ADVANCED
- Entrepreneurial Mindset & Drive: Proficiency Level - ADVANCED
- Business Acumen & Diligence: Proficiency Level - ADVANCED
We believe you will love working at HALA!
- We have an inclusive and diverse culture that encourages innovation and flexibility in remote, in-office, and hybrid work setups.
- We offer highly competitive compensation packages, including the potential for shares.
- We prioritize personal development and offer regular training and an annual learning stipend to tackle new challenges and grow your career in a hyper-growth environment.
- Join a talented team of over 30 nationalities working in 7 countries and gain valuable experience in an exciting industry.
- We offer autonomy, mentoring, and challenging goals that create incredible opportunities for both you and the company.
- You will be given a lot of responsibility and trust. We believe that the best results come when the people responsible for a function are given the freedom to do what they think is best.