📍 المملكة العربية السعودية تحديث مستمر على مدار الساعة

Jobgether تعلن عن وظيفة مهندس رؤية حاسوبية أول في السعودية

Senior CV Engineer
🏢 Jobgether
🕒 نُشرت: (اليوم) 📍 السعودية وظائف الهندسة والتقنية
التقديم على الوظيفة من المصدر الرسمي ↗

تفاصيل الوظيفة

مطلوب مهندس أول في الرؤية الحاسوبية (Senior CV Engineer) للعمل عن بُعد لصالح شركة شريكة عبر منصة Jobgether، ومقر العمل في السعودية. تتولى الشركة الشريكة إدارة جميع الطلبات والخطوات التالية. ستساهم في تطوير الجيل التالي من التقنيات البصرية المدعومة بالذكاء الاصطناعي، والعمل على نماذج توليدية متقدمة لإنتاج محتوى بصري واقعي عالي الجودة، مع فرصة للتأثير على بنية النماذج واستراتيجيات التحسين.

المهام والمسؤوليات

  • تدريب وضبط وتحسين نماذج الرؤية الحاسوبية التوليدية، بما في ذلك architectures القائمة على النص-إلى-صورة، الصورة-إلى-صورة، الفيديو-إلى-صورة، والنماذج المُكيّفة (adapter-based).
  • تطوير وتحسين أنظمة تصنيف الصور وترتيبها ووصفها القادرة على فهم السياقات البصرية المعقدة.
  • مراقبة أحدث الأبحاث والتطورات مفتوحة المصدر في الرؤية الحاسوبية، وترجمة النتائج إلى خطط تطوير قابلة للتنفيذ.
  • تصميم وتنفيذ وامتلاك أطر تقييم النماذج وعمليات التحقق من الجودة لضمان التحسين المستمر في الأداء.
  • تحسين استدلال النماذج من خلال تقنيات مثل تسريع الانتشار (diffusion acceleration) والكمية (quantization) وتحسينات مستوى الأداء الإطاري.
  • التعاون مع فرق تعلم الآلة لدمج قدرات الرؤية الحاسوبية المتقدمة في أنظمة الذكاء الاصطناعي الأوسع، والمساهمة في مبادرات الذكاء الاصطناعي متعددة الوسائط التي تجمع الفهم البصري واللغوي.

الشروط والمتطلبات

  • 5+ سنوات من الخبرة في العمل مع نماذج الانتشار (diffusion models)، بما في ذلك التدريب والضبط الدقيق والتخصيص الهيكلي.
  • خبرة قوية مع أطر ومكتبات تعلم الآلة الحديثة، خاصة Diffusers و Transformers.
  • خبرة عملية في تنفيذ وتحسين IP-Adapters أو تقنيات التكييف المماثلة.
  • مهارات برمجية قوية وخبرة عملية في هندسة الواجهة الخلفية، ويفضل أن تتضمن Python ومعرفة ببيئات النشر القابلة للتوسع.
  • فهم عميق لممارسات التعلم العميق والذكاء الاصطناعي التوليدي والرؤية الحاسوبية.
  • القدرة على قيادة المبادرات البحثية بشكل مستقل وترجمة النتائج التجريبية إلى حلول جاهزة للإنتاج، مع مهارات ممتازة في حل المشكلات والتفكير التحليلي والتعاون.

المهارات المطلوبة

  • خبرة في تقنيات مطابقة التدفق (flow matching) وتقطير نماذج الانتشار (diffusion model distillation).
  • معرفة بـ DPO ومنهجيات الضبط الدقيق المتقدمة للنص-إلى-صورة.
  • خبرة في توليد الفيديو من النص (text-to-video generation) وضبط CLIP الدقيق.
  • الإلمام بنماذج اللغة الكبيرة متعددة الوسائط (multimodal LLMs).
  • خلفية في معالجة اللغة الطبيعية (NLP) وتدريب نماذج اللغة الكبيرة أو تطوير المحادثات الذكية.

المزايا

  • وظيفة عن بُعد بدوام كامل مع مرونة في العمل من الموقع المفضل.
  • حزمة تعويضات تنافسية، تُفصَّل تفاصيل الراتب أثناء عملية التوظيف.
  • 28 يومًا تقويميًا إجازة سنوية.
  • 7 أيام للعافية سنويًا للتعافي الشخصي والرفاهية.
  • برنامج مكافآت الإحالة بقيمة تصل إلى 5,000 دولار أمريكي لكل توصية ناجحة لمرشح.
  • استرداد 50% من تكاليف التطوير المهني والدورات التدريبية والمؤتمرات والفعاليات الصناعية.
  • خصومات مؤسسية على برامج تعلم اللغة الإنجليزية.
  • بدل صحي سنوي يصل إلى 1,000 دولار أمريكي إجمالي للتأمين الصحي أو النفقات الطبية أو دعم الرعاية الصحية لأفراد الأسرة المؤهلين، بالإضافة إلى دعم مكان العمل بما في ذلك مكتب مجهز بالكامل أو خيارات العمل المشترك، أو استرداد يصل إلى 1,000 دولار أمريكي إجمالي كل ثلاث سنوات لنفقات المكتب المنزلي ومساحة العمل.
عرض النص الأصلي للإعلان
This position is listed on behalf of a partner company, which manages all applications and next steps. Our partner is looking for a Senior CV Engineer based in Saudi Arabia.

This is an exciting opportunity for an experienced Computer Vision professional to help shape the next generation of AI-powered visual technologies. In this role, you will work on advanced generative models, developing systems capable of producing high-quality photorealistic and stylized visual content. You will contribute to cutting-edge research initiatives while transforming innovative ideas into scalable production solutions. The position combines deep technical expertise with strategic ownership, allowing you to influence model architecture, optimization, and long-term roadmap decisions. Working within a globally distributed and highly collaborative environment, you will have the opportunity to drive meaningful innovation at the intersection of computer vision, multimodal AI, and machine learning. This role is ideal for individuals passionate about pushing the boundaries of generative AI and visual understanding systems.

Accountabilities

  • Train, fine-tune, and enhance generative computer vision models, including text-to-image, image-to-image, video-to-image, and adapter-based architectures.
  • Develop and improve image classification, ranking, and captioning systems capable of understanding complex visual contexts.
  • Monitor emerging research trends and open-source advancements in computer vision, translating findings into actionable development roadmaps.
  • Design, implement, and own model evaluation frameworks and quality validation processes to ensure continuous performance improvement.
  • Optimize model inference through techniques such as diffusion acceleration, quantization, and framework-level performance enhancements.
  • Collaborate with machine learning teams to integrate advanced computer vision capabilities into broader AI systems.
  • Contribute to multimodal AI initiatives that combine visual and language understanding for richer user experiences.

Requirements

  • 5+ years of experience working with diffusion models, including training, fine-tuning, and architectural customization.
  • Strong expertise with modern machine learning frameworks and libraries, particularly Diffusers and Transformers.
  • Hands-on experience implementing and optimizing IP-Adapters or similar conditioning techniques.
  • Solid programming skills and practical backend engineering experience, ideally with Python and exposure to scalable deployment environments.
  • Strong understanding of deep learning, generative AI, and computer vision best practices.
  • Ability to independently drive research initiatives and translate experimental results into production-ready solutions.
  • Excellent problem-solving, analytical thinking, and collaboration skills.

Nice To Have

  • Experience with flow matching techniques and diffusion model distillation.
  • Knowledge of DPO and other advanced text-to-image fine-tuning methodologies.
  • Experience with text-to-video generation and CLIP fine-tuning.
  • Familiarity with multimodal large language models.
  • Background in NLP, LLM training, or conversational AI development.

Benefits

  • Fully remote full-time position with flexibility to work from your preferred location.
  • Competitive compensation package, with salary details shared during the recruitment process.
  • 28 calendar days of annual vacation.
  • 7 wellness days per year for personal recovery and wellbeing.
  • Referral bonus program with rewards of up to $5,000 for successful candidate recommendations.
  • 50% reimbursement for professional development, training programs, conferences, and industry events.
  • Corporate discounts for English language learning programs.
  • Annual health allowance of up to $1,000 gross for health insurance, medical expenses, or healthcare support for eligible family members.
  • Workplace support, including fully equipped office or coworking options, or reimbursement of up to $1,000 gross every three years for home office and workspace expenses.
  • Internal recognition and rewards program that allows employees to earn bonuses and redeem them for merchandise, experiences, wellness services, and team activities.

How Jobgether Works

We use an AI-powered matching process to ensure your application is reviewed quickly, objectively, and fairly against the role's core requirements. Our system identifies the top-fitting candidates, and this shortlist is then shared directly with the hiring company. The final decision and next steps (interviews, assessments) are managed by their internal team.

We appreciate your interest and wish you the best!

Why Apply Through Jobgether?

Data Privacy Notice: By submitting your application, you acknowledge that Jobgether will process your personal data to evaluate your candidacy and share relevant information with the hiring employer. This processing is based on legitimate interest and pre-contractual measures under applicable data protection laws (including GDPR). You may exercise your rights (access, rectification, erasure, objection) at any time.

We may use artificial intelligence (AI) tools to support parts of the hiring process, such as reviewing applications, analyzing resumes, or assessing responses and identifying potential inconsistencies or verification signals in application materials based on available information. These tools assist our recruitment team but do not replace human judgment. Final hiring decisions are ultimately made by humans. If you would like more information about how your data is processed, please contact us.

المصدر: LinkedIn - أُضيفت للموقع في 16 يونيو 2026

وظائف أخرى لدى Jobgether