50K ₽–80K ₽/мес
подтверждённая
Опубликовано 19.03.2026
О позиции
Мы ищем ML-разработчика (Inference) для работы в ML-сервисах Yandex Cloud. Эта позиция предлагает возможность работать над передовыми технологиями в области машинного обучения и оптимизации инференса. Вы будете заниматься производительностью и масштабируемостью инференса, а также разрабатывать распределённые системы для больших моделей.
Чем вы будете заниматься
- Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и continuous batching.
- Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и автоматическое масштабирование.
- Низкоуровневая оптимизация с использованием CUDA/Triton-kernels, профилирование и оптимизация памяти.
- Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.
Требования
- Понимание устройства трансформеров и LLM-инференса: attention, кеширование, последовательная генерация.
- Опыт оптимизации под GPU: CUDA/Triton, профилирование, работа с Tensor Cores.
- Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
- Навыки разработки на Python и одном из системных языков (C++ или Go).
- Опыт построения и эксплуатации высоконагруженных сервисов (Kubernetes, gRPC, observability).
Будет плюсом
- Опыт работы с балансировщиками и поддержкой multi-node-сценариев.
- Знания в области облачной инфраструктуры и интеграции с on-prem-сценариями.
Что мы предлагаем
- Конкурентная зарплата и возможность профессионального роста.
- Гибкий график работы и возможность частично удалённой работы.
- Доступ к современным технологиям и инструментам в области ML.
- Команда профессионалов и возможность участия в интересных проектах.
Диапазон зарплаты
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения
Вакансия предлагает интересные задачи в области ML и возможность работы с современными технологиями. Однако, описание вакансии могло бы быть более детализированным.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Формируем профиль успеха...
Анализируем требования вакансии и данные рынка
Обзор рынка
Объём рынка Python в 2026
$9.2B
Годовой рост
12.5%
Внедрение AI
75%
Инвестиции в ML
+150%
Спрос на кадры в ML
+30%
Средняя ЗП ML-разработчика
180K ₽
Навыки и требования
Обязательные
PythonCUDATriton
Растущий спрос
TensorFlowScikit-LearnML Ops
Снижающийся спрос
MatlabR
Тренды отрасли
Рост применения ML в облачных сервисах
Ожидается, что к 2026 году 80% компаний будут использовать ML в своих облачных решениях.
Увеличение инвестиций в AI
Инвестиции в AI-технологии в России вырастут на 150% к 2026 году, что создаст новые возможности для ML-разработчиков.
Новости отрасли
Загружаем новости отрасли...
Ищем релевантные статьи за последние 6 месяцев
Похожие вакансии
Программист 1С ERP (Финансовые технологии)
180K ₽–270K ₽
Influencer Manager (iGaming)
2K ₽–4K ₽
Исследователь данных (Data Scientist)
ODSJobs·250K ₽–300K ₽
Senior Data Engineer (EdTech)
EdTech-продукт·5K ₽–8K ₽
Аналитик 1С (FinTech)
1K ₽–3K ₽
Сценарист / Контент-менеджер (Медиа)
2K ₽–3K ₽
Системный аналитик (РКО)
Selecty·180K ₽–310K ₽
Аниматор (Blender) для 3D анимации
Horny Herring Studios·2K ₽–3K ₽
Стажёр QA-разработчик (IT)
Авито·5K ₽–8K ₽
Консультант 1С:ERP (Middle)
Аккредитованная IT-компания·200K ₽–250K ₽
Разработчик сайта на Tilda (удалённо)
2K ₽–3K ₽
Менеджер по работе с клиентами (События)
Painty·60K ₽–120K ₽
Менеджер по контенту (SMM) для Инстаграма
Анна Мегрикян·80K ₽–100K ₽
AI-дизайнер (графический дизайн)
Singular Advertising·1K ₽–2K ₽
Инженер SOC (Кибербезопасность)
RWB·70K ₽–120K ₽