Senior Data Scientist (NLP|LLM) в Digital Health@ Digital Health

80K ₽–120K ₽/мес
Опубликовано 10.04.2026

О позиции

Мы ищем Senior Data Scientist (NLP|LLM) для работы в крупнейшей в России Digital Health платформе, которая объединяет различные сервисы цифровой медицины. Эта позиция предлагает уникальную возможность влиять на развитие медицинских технологий и улучшение качества медицинских услуг. Вы будете работать в уютном офисе в БЦ Симонов Плаза с видом на Москва-реку или удалённо, в зависимости от ваших предпочтений.

Чем вы будете заниматься

  • Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
  • Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
  • Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
  • Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
  • Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Требования

  • 3+ лет опыта в NLP/ML, уверенное знание Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
  • Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
  • Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.
  • Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
  • Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.
  • Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.
  • Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation.
  • Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.
  • Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманное chunking, grounding.

Что мы предлагаем

  • Конкурентная зарплата, обсуждаемая индивидуально.
  • Гибкий график работы и возможность удалённой работы.
  • Комфортный офис в центре Москвы с прекрасным видом.
  • Доступ к современным технологиям и инструментам.
  • Возможности для профессионального роста и развития.
  • Работа в дружной команде профессионалов.
  • Участие в интересных и значимых проектах в области цифровой медицины.
Диапазон зарплаты
Почему эта вакансия
8.2
8.2 из 10
оценка совпадения

Вакансия предлагает интересные задачи в области цифровой медицины и конкурентные условия труда. Однако, отсутствие четкой информации о зарплате может вызвать вопросы у кандидатов.

Обязательные
0/1
Желательные
0/1
Бонус
0/1
Требования к языку
RussianNative
English(опционально)B2
БазовыйСреднийПродвинутыйРодной

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка 2026
$8.5B
Годовой рост
15.2%
Внедрение AI
75%
Инвестиции
+120%
Спрос на кадры
+40%
Средняя ЗП
220K ₽

Навыки и требования

Обязательные
PythonNLPMachine Learning
Растущий спрос
Deep LearningData EngineeringMLOps
Снижающийся спрос
RMATLAB

Тренды отрасли

Рост применения NLP в здравоохранении
Применение технологий NLP в здравоохранении увеличивается на 30% в год, что позволяет улучшить взаимодействие с пациентами и анализ данных.
Увеличение спроса на LLM
Модели большого языка (LLM) становятся все более популярными, с ростом использования на 50% в области анализа медицинских данных.

Новости отрасли

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев