ML-разработчик (Inference) в Yandex Cloud@ Яндекс

5K $–8K $/мес
Опубликовано 21.04.2026

О позиции

Мы ищем ML-разработчика (Inference) в Yandex Cloud, который будет работать над оптимизацией инференса больших языковых моделей. Ваша роль будет включать в себя множество интересных задач, связанных с производительностью и масштабируемостью инференса, а также с дистрибуцией и оркестрацией систем.

Чем вы будете заниматься

  • Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и KV-cache.
  • Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и сервис-мешами.
  • Низкоуровневая оптимизация с использованием CUDA и Triton-kernels, работа с NVLink и RDMA.
  • Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.
  • Поддержка on-prem-сценариев у клиентов и интеграция с облачной инфраструктурой.

Требования

  • Понимание устройства трансформеров и LLM-инференса, включая attention и кеширование.
  • Опыт оптимизации под GPU, включая CUDA и профилирование.
  • Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
  • Навыки разработки на Python и одном из системных языков (C++ или Go).
  • Опыт построения и эксплуатации высоконагруженных сервисов, таких как Kubernetes и gRPC.

Будет плюсом

  • Знание принципов observability и мониторинга.
  • Опыт работы с балансировщиками и автоматическим масштабированием.
  • Навыки работы с многопоточными и распределёнными системами.

Что мы предлагаем

  • Конкурентная зарплата и возможность работать в гибридном формате.
  • Доступ к современным технологиям и инструментам.
  • Возможности для профессионального роста и развития.
  • Работа в команде экспертов в области ML и AI.
  • Участие в интересных проектах с использованием передовых технологий.

Если вы хотите стать частью нашей команды и развивать ML-сервисы в Yandex Cloud, переходите по ссылке для отклика: Яндекс Вакансии.

Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения

Вакансия предлагает интересные задачи и возможности для профессионального роста в области ML. Однако, описание может быть более детализированным.

Требования к языку
RussianC1
English(опционально)B2
БазовыйСреднийПродвинутыйРодной

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка 2026
$8.5B
Годовой рост
22.5%
Внедрение AI
75%
Инвестиции
+150%

Навыки и требования

Обязательные
MLPythonCUDA
Растущий спрос
TensorFlowData EngineeringMLOps
Снижающийся спрос
TheanoMapReduce

Тренды отрасли

Рост автоматизации
Автоматизация процессов машинного обучения увеличивается на 40% в 2025 году, что приводит к повышению эффективности разработки.
Увеличение использования облачных решений
Около 65% компаний в России планируют перейти на облачные платформы для ML до 2026 года, что открывает новые возможности для ML-разработчиков.

Новости Cloud Services

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев

Похожие вакансии
Motion Designer для разработки мобильных игр
Starplay Games·200K ₽–300K ₽
Контент-продюсер для Instagram — развитие личного бренда в мужском стиле
150K ₽
Менеджер контентных проектов — улучшение рабочих процессов
Т—Ж·110K ₽–180K ₽
Middle UI/UX дизайнер для улучшения визуальных материалов
80K ₽–120K ₽
Литературный редактор — создание глянцевого журнала для фитнес-индустрии
Nova Fitness Consulting·80K ₽–110K ₽
Редактор спортивного проекта — работа с контентом о спорте и киберспорте
iSEO·70K ₽–90K ₽
Проджект-менеджер для онлайн-школы дизайна интерьера
Академия дизайна интерьера·110K ₽–180K ₽
DevOps-инженер — Senior DevOps Engineer для платформы зн…
Social Discovery Group·50K ₽–80K ₽
Программист для автоматизации и интеграций
80K ₽–110K ₽
Разработчик внутренних инструментов для поддержки разработки игр
200K ₽–300K ₽
Финансовый контролёр — инвестиционный анализ и методологическая поддержка
Volga Group·180K ₽–320K ₽
SMM-менеджер — сеть детских киношкол
Star-studios·50K ₽
Project Manager — управление креативными проектами
Креативное агентство·120K ₽
Golang-разработчик для разработки высоконагруженных систем
М Тех·200K ₽–300K ₽
Менеджер по продажам — работа с кредитами и инвестициями
Arbitrazh·60K ₽–90K ₽