5K $–8K $/мес
подтверждённая
Опубликовано 21.04.2026
О позиции
Мы ищем ML-разработчика (Inference) в Yandex Cloud, который будет работать над оптимизацией инференса больших языковых моделей. Ваша роль будет включать в себя множество интересных задач, связанных с производительностью и масштабируемостью инференса, а также с дистрибуцией и оркестрацией систем.
Чем вы будете заниматься
- Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и KV-cache.
- Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и сервис-мешами.
- Низкоуровневая оптимизация с использованием CUDA и Triton-kernels, работа с NVLink и RDMA.
- Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.
- Поддержка on-prem-сценариев у клиентов и интеграция с облачной инфраструктурой.
Требования
- Понимание устройства трансформеров и LLM-инференса, включая attention и кеширование.
- Опыт оптимизации под GPU, включая CUDA и профилирование.
- Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
- Навыки разработки на Python и одном из системных языков (C++ или Go).
- Опыт построения и эксплуатации высоконагруженных сервисов, таких как Kubernetes и gRPC.
Будет плюсом
- Знание принципов observability и мониторинга.
- Опыт работы с балансировщиками и автоматическим масштабированием.
- Навыки работы с многопоточными и распределёнными системами.
Что мы предлагаем
- Конкурентная зарплата и возможность работать в гибридном формате.
- Доступ к современным технологиям и инструментам.
- Возможности для профессионального роста и развития.
- Работа в команде экспертов в области ML и AI.
- Участие в интересных проектах с использованием передовых технологий.
Если вы хотите стать частью нашей команды и развивать ML-сервисы в Yandex Cloud, переходите по ссылке для отклика: Яндекс Вакансии.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения
Вакансия предлагает интересные задачи и возможности для профессионального роста в области ML. Однако, описание может быть более детализированным.
Требования к языку
RussianC1
English(опционально)B2
БазовыйСреднийПродвинутыйРодной
Формируем профиль успеха...
Анализируем требования вакансии и данные рынка
Обзор рынка
Объём рынка 2026
$8.5B
Годовой рост
22.5%
Внедрение AI
75%
Инвестиции
+150%
Навыки и требования
Обязательные
MLPythonCUDA
Растущий спрос
TensorFlowData EngineeringMLOps
Снижающийся спрос
TheanoMapReduce
Тренды отрасли
Рост автоматизации
Автоматизация процессов машинного обучения увеличивается на 40% в 2025 году, что приводит к повышению эффективности разработки.
Увеличение использования облачных решений
Около 65% компаний в России планируют перейти на облачные платформы для ML до 2026 года, что открывает новые возможности для ML-разработчиков.
Новости Cloud Services
Загружаем новости отрасли...
Ищем релевантные статьи за последние 6 месяцев
Похожие вакансии
Motion Designer для разработки мобильных игр
Starplay Games·200K ₽–300K ₽
Контент-продюсер для Instagram — развитие личного бренда в мужском стиле
150K ₽
Менеджер контентных проектов — улучшение рабочих процессов
Т—Ж·110K ₽–180K ₽
Middle UI/UX дизайнер для улучшения визуальных материалов
80K ₽–120K ₽
Литературный редактор — создание глянцевого журнала для фитнес-индустрии
Nova Fitness Consulting·80K ₽–110K ₽
Редактор спортивного проекта — работа с контентом о спорте и киберспорте
iSEO·70K ₽–90K ₽
Проджект-менеджер для онлайн-школы дизайна интерьера
Академия дизайна интерьера·110K ₽–180K ₽
DevOps-инженер — Senior DevOps Engineer для платформы зн…
Social Discovery Group·50K ₽–80K ₽
Программист для автоматизации и интеграций
80K ₽–110K ₽
Разработчик внутренних инструментов для поддержки разработки игр
200K ₽–300K ₽
Финансовый контролёр — инвестиционный анализ и методологическая поддержка
Volga Group·180K ₽–320K ₽
SMM-менеджер — сеть детских киношкол
Star-studios·50K ₽
Project Manager — управление креативными проектами
Креативное агентство·120K ₽
Golang-разработчик для разработки высоконагруженных систем
М Тех·200K ₽–300K ₽
Менеджер по продажам — работа с кредитами и инвестициями
Arbitrazh·60K ₽–90K ₽