ML-разработчик (Inference) в Yandex Cloud@ Яндекс

50K ₽–80K ₽/мес
Опубликовано 19.03.2026

О позиции

Мы ищем ML-разработчика (Inference) для работы в ML-сервисах Yandex Cloud. Эта позиция предлагает возможность работать над передовыми технологиями в области машинного обучения и оптимизации инференса. Вы будете заниматься производительностью и масштабируемостью инференса, а также разрабатывать распределённые системы для больших моделей.

Чем вы будете заниматься

  • Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и continuous batching.
  • Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и автоматическое масштабирование.
  • Низкоуровневая оптимизация с использованием CUDA/Triton-kernels, профилирование и оптимизация памяти.
  • Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.

Требования

  • Понимание устройства трансформеров и LLM-инференса: attention, кеширование, последовательная генерация.
  • Опыт оптимизации под GPU: CUDA/Triton, профилирование, работа с Tensor Cores.
  • Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
  • Навыки разработки на Python и одном из системных языков (C++ или Go).
  • Опыт построения и эксплуатации высоконагруженных сервисов (Kubernetes, gRPC, observability).

Будет плюсом

  • Опыт работы с балансировщиками и поддержкой multi-node-сценариев.
  • Знания в области облачной инфраструктуры и интеграции с on-prem-сценариями.

Что мы предлагаем

  • Конкурентная зарплата и возможность профессионального роста.
  • Гибкий график работы и возможность частично удалённой работы.
  • Доступ к современным технологиям и инструментам в области ML.
  • Команда профессионалов и возможность участия в интересных проектах.
Диапазон зарплаты
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения

Вакансия предлагает интересные задачи в области ML и возможность работы с современными технологиями. Однако, описание вакансии могло бы быть более детализированным.

Обязательные
0/1
Желательные
0/1
Бонус
0/1

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка Python в 2026
$9.2B
Годовой рост
12.5%
Внедрение AI
75%
Инвестиции в ML
+150%
Спрос на кадры в ML
+30%
Средняя ЗП ML-разработчика
180K ₽

Навыки и требования

Обязательные
PythonCUDATriton
Растущий спрос
TensorFlowScikit-LearnML Ops
Снижающийся спрос
MatlabR

Тренды отрасли

Рост применения ML в облачных сервисах
Ожидается, что к 2026 году 80% компаний будут использовать ML в своих облачных решениях.
Увеличение инвестиций в AI
Инвестиции в AI-технологии в России вырастут на 150% к 2026 году, что создаст новые возможности для ML-разработчиков.

Новости отрасли

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев