Senior LLM Infrastructure & Reliability Engineer (AI)@ Лондонская продуктовая компания
7K $/мес
Опубликовано 05.05.2026
7K $/мес
подтверждённая
Опубликовано 05.05.2026
О позиции
Мы ищем Senior LLM Infrastructure & Reliability Engineer для создания и эксплуатации высокопроизводительной платформы для локального вывода LLM с использованием кластеров на базе GPU. Эта вакансия предполагает работу с системной инфраструктурой, ориентированной на операционную способность аппаратных и программных стеков AI. Это не роль по обучению моделей или исследованию данных.
Чем вы будете заниматься
- Операции обслуживания: запуск и масштабирование LLM-сервисов с использованием Ray/Ray Serve, Docker и Linux.
- Управление выводом: развертывание моделей через vLLM/Hugging Face и их экспонирование через высокопроизводительные API, совместимые с OpenAI.
- Оптимизация производительности: настройка использования GPU, пакетирования запросов, задержки и пропускной способности для максимальной эффективности аппаратного обеспечения.
- Инженерия надежности: поддержание стабильности системы через мониторинг, надежную обработку ошибок и автоматическое восстановление.
- Управление жизненным циклом: полное владение циклом развертывания модели: версионирование, обновления, бенчмаркинг и откаты.
- Поддержка агентов: предоставление инфраструктурной поддержки внутренним командам, работающим с агентами, автоматизацией и рабочими процессами AI.
Требования
- Основы: Windows, Linux, Docker, CI/CD, Сетевые технологии (балансировка нагрузки, маршрутизация, обнаружение сервисов), Python, Kubernetes.
- Стек вывода: vLLM, Hugging Face, Токенизация, Квантование.
- Распределенные системы: кластеры Ray, оркестрация.
- Операции с аппаратным обеспечением: CUDA, управление VRAM, многопроцессорные установки.
- Backend и API: FastAPI, аутентификация, ограничение частоты, настройка производительности.
- Наблюдаемость: метрики в реальном времени, логирование, дашборды (Grafana/Prometheus).
Будет плюсом
- Автоматизация тестирования: сотрудничество с командой QA для реализации автоматизированного тестирования для рабочих процессов LLM.
- Инженерия подсказок: проверка стабильности, доступности, скорости и отзывчивости различных моделей.
- Оценка: поддержка "LLM-as-a-judge" и автоматизированных оценочных конвейеров для обеспечения качества вывода.
- Стабильность агентов: вклад в стабильность поведения агентов через инженерные подсказки и соблюдение ограничений.
- Бенчмаркинг: поддержание наборов подсказок и регрессионных бенчмарков для раннего выявления падений производительности.
- Интеграция с фреймворками: поддержка интеграции с фреймворками агентов, такими как LangGraph и n8n.
- Обратная связь: включение телеметрии для оптимизации подсказок, маршрутизации и выбора модели.
Что мы предлагаем
- Конкурентная заработная плата до 8500 USD в месяц.
- Удалённая работа с гибким графиком.
- Работа в международной команде с возможностью профессионального роста.
- Участие в интересных проектах в области AI и LLM.
- Поддержка обучения и развития.
- Современные инструменты и технологии для работы.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
8.1
8.1 из 10
оценка совпадения
Вакансия предлагает интересные задачи в области AI и LLM с конкурентной зарплатой. Однако, требуется опыт и знания в специфических технологиях.
Требования к языку
RussianNative
БазовыйСреднийПродвинутыйРодной
Формируем профиль успеха...
Анализируем требования вакансии и данные рынка
Обзор рынка
Объём рынка 2026
$25B
Годовой рост
15.2%
Внедрение AI
70%
Инвестиции
+200%
Навыки и требования
Обязательные
LinuxDockerCI/CD
Растущий спрос
KubernetesRayHugging Face
Снижающийся спрос
jQueryAngularJS 1.x
Тренды отрасли
Рост использования контейнеризации
Контейнеризация на базе Linux, таких как Docker и Kubernetes, продолжает расти, с увеличением использования на 30% в 2025 году.
Интеграция AI в DevOps
AI-инструменты становятся стандартом в DevOps, с 55% компаний, внедривших AI для автоматизации процессов.
Новости AI/Big Data
Загружаем новости отрасли...
Ищем релевантные статьи за последние 6 месяцев
Похожие вакансии
DS-разработчик — интеграция LLM-решений в продукты
Т1·180K ₽–320K ₽
Финансовый аналитик — анализ данных и оптимизация расходов
Crypto Headhunter·200K ₽–300K ₽
Middle+ ML Engineer — работа с RecSys и NLP
Дром·260K ₽–310K ₽
Digital Product Owner для вклада и накопительных счетов
Wildberries Банк·300K ₽–500K ₽
Senior Full Stack Web Developer — React, Node.js и PHP
Watts·72 ₽–80 ₽
Frontend Developer III — разработка UI-компонентов на React
RealPage Inc.·618 ₽–1K ₽
AI Visual Creator для создания фотореалистичных изображений
110K ₽–180K ₽
QA-инженер — JIRA — проектов в Digital Products
Цифровые привычки·190K ₽–230K ₽
Frontend Team/Tech Lead — работа с международными проектами
Index Agency·35 ₽–45 ₽
Проджект-менеджер для отдела Business Operations
Dream Offer·4K ₽–5K ₽
Middle/Senior PHP Backend-разработчик — Symfony и микросервисы
5K ₽
Senior Frontend-разработчик — проект Т-Банк
Новэлект·260K ₽–320K ₽
Performance Аналитик — нагрузочное тестирование в финтех
Vadarod·4K ₽–10K ₽
Авитолог — оптимизация объявлений на Avito
110K ₽–180K ₽
Integration Manager — API
IREV·49 ₽–87 ₽