~5K $–8K $/мес
оценка по рынку
Опубликовано 21.04.2026
О позиции
Мы ищем ML-разработчика (Inference) в Yandex Cloud, который будет работать над оптимизацией инференса больших языковых моделей. Ваша роль будет включать в себя множество интересных задач, связанных с производительностью и масштабируемостью инференса, а также с дистрибуцией и оркестрацией систем.
Чем вы будете заниматься
- Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и KV-cache.
- Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и сервис-мешами.
- Низкоуровневая оптимизация с использованием CUDA и Triton-kernels, работа с NVLink и RDMA.
- Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.
- Поддержка on-prem-сценариев у клиентов и интеграция с облачной инфраструктурой.
Требования
- Понимание устройства трансформеров и LLM-инференса, включая attention и кеширование.
- Опыт оптимизации под GPU, включая CUDA и профилирование.
- Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
- Навыки разработки на Python и одном из системных языков (C++ или Go).
- Опыт построения и эксплуатации высоконагруженных сервисов, таких как Kubernetes и gRPC.
Будет плюсом
- Знание принципов observability и мониторинга.
- Опыт работы с балансировщиками и автоматическим масштабированием.
- Навыки работы с многопоточными и распределёнными системами.
Что мы предлагаем
- Конкурентная зарплата и возможность работать в гибридном формате.
- Доступ к современным технологиям и инструментам.
- Возможности для профессионального роста и развития.
- Работа в команде экспертов в области ML и AI.
- Участие в интересных проектах с использованием передовых технологий.
Если вы хотите стать частью нашей команды и развивать ML-сервисы в Yandex Cloud, переходите по ссылке для отклика: Яндекс Вакансии.
Диапазон зарплаты
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения
Вакансия предлагает интересные задачи и возможности для профессионального роста в области ML. Однако, описание может быть более детализированным.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Требования к языку
RussianC1
English(опционально)B2
БазовыйСреднийПродвинутыйРодной
Формируем профиль успеха...
Анализируем требования вакансии и данные рынка
Обзор рынка
Объём рынка 2026
$8.5B
Годовой рост
22.5%
Внедрение AI
75%
Инвестиции
+150%
Спрос на кадры
+30%
Средняя ЗП
150K ₽
Навыки и требования
Обязательные
MLPythonCUDA
Растущий спрос
TensorFlowData EngineeringMLOps
Снижающийся спрос
TheanoMapReduce
Тренды отрасли
Рост автоматизации
Автоматизация процессов машинного обучения увеличивается на 40% в 2025 году, что приводит к повышению эффективности разработки.
Увеличение использования облачных решений
Около 65% компаний в России планируют перейти на облачные платформы для ML до 2026 года, что открывает новые возможности для ML-разработчиков.
Новости отрасли
Загружаем новости отрасли...
Ищем релевантные статьи за последние 6 месяцев
Похожие вакансии
Data Analyst (iGaming)
2K ₽–3K ₽
Интернет-маркетолог (e-commerce)
РеМо·50K ₽–60K ₽
Middle+ Fullstack разработчик (TrueSpace и SWOIS)
2K ₽–3K ₽
Дизайнер презентаций (Sales / Product)
50K ₽–80K ₽
Marketing Lead (SMM) — Ресторанный бизнес
3K ₽–3K ₽
Дизайнер продукта (ФинТех)
Магнит·60K ₽–120K ₽
Middle/Senior Python Backend Engineer (Matrix)
Calm·2K ₽–4K ₽
Full Stack Software Engineer (AI Research)
Apollo·11K ₽–23K ₽
HR менеджер (Фитнес)
Hawaii Fitboxing·130K ₽
Senior Python разработчик (Airflow / dbt)
Arenadata·10K ₽–13K ₽
YouTube-продюсер для онлайн-школы финансовой грамотности
50K ₽–80K ₽
SEO-архитектор / SEO-стратег (разовая работа)
5K ₽
3D-моделлер (GTA 5)
Epic-RP·5K ₽–8K ₽
Менеджер по подбору и адаптации персонала (HR)
STROTSKIS GROUP·100K ₽–130K ₽
Бизнес-ассистент (Москва)
ASKERI GALLERY·60K ₽–120K ₽