Data Scientist для медицинских LLM@ СберЗдоровье

150K ₽–250K ₽/мес
Опубликовано 20.05.2026

О позиции

Мы ищем Data Scientist для работы в команде СберЗдоровье. Ваша задача будет заключаться в проектировании и поддержке полного цикла улучшения медицинских LLM. Вы будете заниматься сбором, очисткой, версионированием данных, а также обучением и дообучением моделей. Эта вакансия Data Scientist удалённо предлагает возможность влиять на развитие медицинских технологий в России.

Чем вы будете заниматься

  • Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
  • Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
  • Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
  • Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
  • Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Требования

  • 3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
  • Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
  • Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML).
  • Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
  • Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.

Будет плюсом

  • Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.
  • Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation.
  • Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.
  • Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманное chunking, grounding.

Что мы предлагаем

  • Сильную команду профессионалов, увлеченных своим делом.
  • Возможность развития в команде ведущей MedTech-компании России.
  • Уютный офис в Сити с панорамным видом на город, гибридный формат работы.
  • Корпоративную технику.
  • Медицинскую программу, включающую телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики.
  • Оплачиваемые курсы английского языка.
  • Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента).
  • СберУниверситет и оплату профильного обучения и курсов.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения

Вакансия предлагает интересные задачи в области медицинских технологий, однако требует значительного опыта в NLP и ML. Условия работы привлекательные, но зарплата могла бы быть выше для такого уровня.

Требования к языку
РусскийC1
Английский(опционально)B2
БазовыйСреднийПродвинутыйРодной

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка 2026
$5.2B
Годовой рост
15.7%
Внедрение AI
72%
Инвестиции
+200%

Навыки и требования

Обязательные
PythonNLPML
Растущий спрос
TensorFlowData EngineeringDeep Learning
Снижающийся спрос
RSAS

Тренды отрасли

Рост использования LLM в медицине
По данным исследований, использование больших языковых моделей (LLM) в медицинских приложениях увеличилось на 60% в последние два года, что открывает новые возможности для анализа данных и улучшения диагностики.
Интеграция NLP в клинические процессы
Около 50% медицинских учреждений в России начали внедрять технологии обработки естественного языка (NLP) для автоматизации обработки медицинских записей и улучшения взаимодействия с пациентами.

Новости MedTech

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев

Похожие вакансии
AI Visual Creator для создания фотореалистичных изображений
110K ₽–180K ₽
QA-инженер — JIRA — проектов в Digital Products
Цифровые привычки·190K ₽–230K ₽
Проджект-менеджер для отдела Business Operations
Dream Offer·4K ₽–5K ₽
Middle/Senior PHP Backend-разработчик — Symfony и микросервисы
5K ₽
Performance Аналитик — нагрузочное тестирование в финтех
Vadarod·4K ₽–10K ₽
Авитолог — оптимизация объявлений на Avito
110K ₽–180K ₽
Integration Manager — API
IREV·49 ₽–87 ₽
Бизнес-системный аналитик — оптимизация процессов для крипто-брокеров
CompanionVille·180K ₽–320K ₽
QA-инженер — Java — проектов в B2B SaaS
Caterpillar·6K ₽–6K ₽
Системный аналитик — работа в финтехе
PayDepot·200K ₽–300K ₽
QA-инженер — ClickHouse
235K ₽
Тестировщик-автоматизатор на Python — развитие тестового фреймворка
IT People group·170K ₽–200K ₽
Retention Marketing Manager — управление удержанием пользователей
Ayni Gold·110K ₽–180K ₽
Product Manager для развития канала OfferInside
OfferInside·180K ₽
Технический специалист Bitrix — настройка email-цепочек и сопровождение рассылок
110K ₽–180K ₽