Senior LLM Infrastructure & Reliability Engineer (AI)@ Лондонская продуктовая компания

7K $/мес
Опубликовано 05.05.2026

О позиции

Мы ищем Senior LLM Infrastructure & Reliability Engineer для создания и эксплуатации высокопроизводительной платформы для локального вывода LLM с использованием кластеров на базе GPU. Эта вакансия предполагает работу с системной инфраструктурой, ориентированной на операционную способность аппаратных и программных стеков AI. Это не роль по обучению моделей или исследованию данных.

Чем вы будете заниматься

  • Операции обслуживания: запуск и масштабирование LLM-сервисов с использованием Ray/Ray Serve, Docker и Linux.
  • Управление выводом: развертывание моделей через vLLM/Hugging Face и их экспонирование через высокопроизводительные API, совместимые с OpenAI.
  • Оптимизация производительности: настройка использования GPU, пакетирования запросов, задержки и пропускной способности для максимальной эффективности аппаратного обеспечения.
  • Инженерия надежности: поддержание стабильности системы через мониторинг, надежную обработку ошибок и автоматическое восстановление.
  • Управление жизненным циклом: полное владение циклом развертывания модели: версионирование, обновления, бенчмаркинг и откаты.
  • Поддержка агентов: предоставление инфраструктурной поддержки внутренним командам, работающим с агентами, автоматизацией и рабочими процессами AI.

Требования

  • Основы: Windows, Linux, Docker, CI/CD, Сетевые технологии (балансировка нагрузки, маршрутизация, обнаружение сервисов), Python, Kubernetes.
  • Стек вывода: vLLM, Hugging Face, Токенизация, Квантование.
  • Распределенные системы: кластеры Ray, оркестрация.
  • Операции с аппаратным обеспечением: CUDA, управление VRAM, многопроцессорные установки.
  • Backend и API: FastAPI, аутентификация, ограничение частоты, настройка производительности.
  • Наблюдаемость: метрики в реальном времени, логирование, дашборды (Grafana/Prometheus).

Будет плюсом

  • Автоматизация тестирования: сотрудничество с командой QA для реализации автоматизированного тестирования для рабочих процессов LLM.
  • Инженерия подсказок: проверка стабильности, доступности, скорости и отзывчивости различных моделей.
  • Оценка: поддержка "LLM-as-a-judge" и автоматизированных оценочных конвейеров для обеспечения качества вывода.
  • Стабильность агентов: вклад в стабильность поведения агентов через инженерные подсказки и соблюдение ограничений.
  • Бенчмаркинг: поддержание наборов подсказок и регрессионных бенчмарков для раннего выявления падений производительности.
  • Интеграция с фреймворками: поддержка интеграции с фреймворками агентов, такими как LangGraph и n8n.
  • Обратная связь: включение телеметрии для оптимизации подсказок, маршрутизации и выбора модели.

Что мы предлагаем

  • Конкурентная заработная плата до 8500 USD в месяц.
  • Удалённая работа с гибким графиком.
  • Работа в международной команде с возможностью профессионального роста.
  • Участие в интересных проектах в области AI и LLM.
  • Поддержка обучения и развития.
  • Современные инструменты и технологии для работы.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
8.1
8.1 из 10
оценка совпадения

Вакансия предлагает интересные задачи в области AI и LLM с конкурентной зарплатой. Однако, требуется опыт и знания в специфических технологиях.

Требования к языку
RussianNative
БазовыйСреднийПродвинутыйРодной

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка 2026
$25B
Годовой рост
15.2%
Внедрение AI
70%
Инвестиции
+200%

Навыки и требования

Обязательные
LinuxDockerCI/CD
Растущий спрос
KubernetesRayHugging Face
Снижающийся спрос
jQueryAngularJS 1.x

Тренды отрасли

Рост использования контейнеризации
Контейнеризация на базе Linux, таких как Docker и Kubernetes, продолжает расти, с увеличением использования на 30% в 2025 году.
Интеграция AI в DevOps
AI-инструменты становятся стандартом в DevOps, с 55% компаний, внедривших AI для автоматизации процессов.

Новости AI/Big Data

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев

Похожие вакансии
DS-разработчик — интеграция LLM-решений в продукты
Т1·180K ₽–320K ₽
Финансовый аналитик — анализ данных и оптимизация расходов
Crypto Headhunter·200K ₽–300K ₽
Middle+ ML Engineer — работа с RecSys и NLP
Дром·260K ₽–310K ₽
Digital Product Owner для вклада и накопительных счетов
Wildberries Банк·300K ₽–500K ₽
Senior Full Stack Web Developer — React, Node.js и PHP
Watts·72 ₽–80 ₽
Frontend Developer III — разработка UI-компонентов на React
RealPage Inc.·618 ₽–1K ₽
AI Visual Creator для создания фотореалистичных изображений
110K ₽–180K ₽
QA-инженер — JIRA — проектов в Digital Products
Цифровые привычки·190K ₽–230K ₽
Frontend Team/Tech Lead — работа с международными проектами
Index Agency·35 ₽–45 ₽
Проджект-менеджер для отдела Business Operations
Dream Offer·4K ₽–5K ₽
Middle/Senior PHP Backend-разработчик — Symfony и микросервисы
5K ₽
Senior Frontend-разработчик — проект Т-Банк
Новэлект·260K ₽–320K ₽
Performance Аналитик — нагрузочное тестирование в финтех
Vadarod·4K ₽–10K ₽
Авитолог — оптимизация объявлений на Avito
110K ₽–180K ₽
Integration Manager — API
IREV·49 ₽–87 ₽