50K ₽–80K ₽/мес
подтверждённая
Опубликовано 19.03.2026
О позиции
Мы ищем ML-разработчика (Inference) для работы в ML-сервисах Yandex Cloud. Эта позиция предлагает возможность работать над передовыми технологиями в области машинного обучения и оптимизации инференса. Вы будете заниматься производительностью и масштабируемостью инференса, а также разрабатывать распределённые системы для больших моделей.
Чем вы будете заниматься
- Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и continuous batching.
- Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и автоматическое масштабирование.
- Низкоуровневая оптимизация с использованием CUDA/Triton-kernels, профилирование и оптимизация памяти.
- Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.
Требования
- Понимание устройства трансформеров и LLM-инференса: attention, кеширование, последовательная генерация.
- Опыт оптимизации под GPU: CUDA/Triton, профилирование, работа с Tensor Cores.
- Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
- Навыки разработки на Python и одном из системных языков (C++ или Go).
- Опыт построения и эксплуатации высоконагруженных сервисов (Kubernetes, gRPC, observability).
Будет плюсом
- Опыт работы с балансировщиками и поддержкой multi-node-сценариев.
- Знания в области облачной инфраструктуры и интеграции с on-prem-сценариями.
Что мы предлагаем
- Конкурентная зарплата и возможность профессионального роста.
- Гибкий график работы и возможность частично удалённой работы.
- Доступ к современным технологиям и инструментам в области ML.
- Команда профессионалов и возможность участия в интересных проектах.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения
Вакансия предлагает интересные задачи в области ML и возможность работы с современными технологиями. Однако, описание вакансии могло бы быть более детализированным.
Формируем профиль успеха...
Анализируем требования вакансии и данные рынка
Обзор рынка
Объём рынка Python в 2026
$9.2B
Годовой рост
12.5%
Внедрение AI
75%
Инвестиции в ML
+150%
Навыки и требования
Обязательные
PythonCUDATriton
Растущий спрос
TensorFlowScikit-LearnML Ops
Снижающийся спрос
MatlabR
Тренды отрасли
Рост применения ML в облачных сервисах
Ожидается, что к 2026 году 80% компаний будут использовать ML в своих облачных решениях.
Увеличение инвестиций в AI
Инвестиции в AI-технологии в России вырастут на 150% к 2026 году, что создаст новые возможности для ML-разработчиков.
Новости Cloud Services
Загружаем новости отрасли...
Ищем релевантные статьи за последние 6 месяцев
Похожие вакансии
Frontend-разработчик для проектирования интерфейсов
Т1·180K ₽–320K ₽
DS-разработчик — интеграция LLM-решений в продукты
Т1·180K ₽–320K ₽
Финансовый аналитик — анализ данных и оптимизация расходов
Crypto Headhunter·200K ₽–300K ₽
Middle+ ML Engineer — работа с RecSys и NLP
Дром·260K ₽–310K ₽
Digital Product Owner для вклада и накопительных счетов
Wildberries Банк·300K ₽–500K ₽
AI Visual Creator для создания фотореалистичных изображений
110K ₽–180K ₽
QA-инженер — JIRA — проектов в Digital Products
Цифровые привычки·190K ₽–230K ₽
Проджект-менеджер для отдела Business Operations
Dream Offer·4K ₽–5K ₽
Middle/Senior PHP Backend-разработчик — Symfony и микросервисы
5K ₽
Performance Аналитик — нагрузочное тестирование в финтех
Vadarod·4K ₽–10K ₽
Авитолог — оптимизация объявлений на Avito
110K ₽–180K ₽
Integration Manager — API
IREV·49 ₽–87 ₽
Бизнес-системный аналитик — оптимизация процессов для крипто-брокеров
CompanionVille·180K ₽–320K ₽
Системный аналитик — работа в финтехе
PayDepot·200K ₽–300K ₽
QA-инженер — ClickHouse
235K ₽