ML-разработчик (Inference) в Yandex Cloud@ Яндекс

50K ₽–80K ₽/мес
Опубликовано 19.03.2026

О позиции

Мы ищем ML-разработчика (Inference) для работы в ML-сервисах Yandex Cloud. Эта позиция предлагает возможность работать над передовыми технологиями в области машинного обучения и оптимизации инференса. Вы будете заниматься производительностью и масштабируемостью инференса, а также разрабатывать распределённые системы для больших моделей.

Чем вы будете заниматься

  • Оптимизация throughput и latency при генерации LLM, внедрение техник вроде speculative decoding и continuous batching.
  • Разработка и развитие распределённых систем для инференса, интеграция с Kubernetes и автоматическое масштабирование.
  • Низкоуровневая оптимизация с использованием CUDA/Triton-kernels, профилирование и оптимизация памяти.
  • Разработка API и SDK для разработчиков, автоматизация развёртывания и обновления моделей.

Требования

  • Понимание устройства трансформеров и LLM-инференса: attention, кеширование, последовательная генерация.
  • Опыт оптимизации под GPU: CUDA/Triton, профилирование, работа с Tensor Cores.
  • Умение работать с PyTorch, JAX, TensorRT, HuggingFace TGI или vLLM.
  • Навыки разработки на Python и одном из системных языков (C++ или Go).
  • Опыт построения и эксплуатации высоконагруженных сервисов (Kubernetes, gRPC, observability).

Будет плюсом

  • Опыт работы с балансировщиками и поддержкой multi-node-сценариев.
  • Знания в области облачной инфраструктуры и интеграции с on-prem-сценариями.

Что мы предлагаем

  • Конкурентная зарплата и возможность профессионального роста.
  • Гибкий график работы и возможность частично удалённой работы.
  • Доступ к современным технологиям и инструментам в области ML.
  • Команда профессионалов и возможность участия в интересных проектах.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения

Вакансия предлагает интересные задачи в области ML и возможность работы с современными технологиями. Однако, описание вакансии могло бы быть более детализированным.

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка Python в 2026
$9.2B
Годовой рост
12.5%
Внедрение AI
75%
Инвестиции в ML
+150%

Навыки и требования

Обязательные
PythonCUDATriton
Растущий спрос
TensorFlowScikit-LearnML Ops
Снижающийся спрос
MatlabR

Тренды отрасли

Рост применения ML в облачных сервисах
Ожидается, что к 2026 году 80% компаний будут использовать ML в своих облачных решениях.
Увеличение инвестиций в AI
Инвестиции в AI-технологии в России вырастут на 150% к 2026 году, что создаст новые возможности для ML-разработчиков.

Новости Cloud Services

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев

Похожие вакансии
Frontend-разработчик для проектирования интерфейсов
Т1·180K ₽–320K ₽
DS-разработчик — интеграция LLM-решений в продукты
Т1·180K ₽–320K ₽
Финансовый аналитик — анализ данных и оптимизация расходов
Crypto Headhunter·200K ₽–300K ₽
Middle+ ML Engineer — работа с RecSys и NLP
Дром·260K ₽–310K ₽
Digital Product Owner для вклада и накопительных счетов
Wildberries Банк·300K ₽–500K ₽
AI Visual Creator для создания фотореалистичных изображений
110K ₽–180K ₽
QA-инженер — JIRA — проектов в Digital Products
Цифровые привычки·190K ₽–230K ₽
Проджект-менеджер для отдела Business Operations
Dream Offer·4K ₽–5K ₽
Middle/Senior PHP Backend-разработчик — Symfony и микросервисы
5K ₽
Performance Аналитик — нагрузочное тестирование в финтех
Vadarod·4K ₽–10K ₽
Авитолог — оптимизация объявлений на Avito
110K ₽–180K ₽
Integration Manager — API
IREV·49 ₽–87 ₽
Бизнес-системный аналитик — оптимизация процессов для крипто-брокеров
CompanionVille·180K ₽–320K ₽
Системный аналитик — работа в финтехе
PayDepot·200K ₽–300K ₽
QA-инженер — ClickHouse
235K ₽