Data Engineer (Lakehouse/Data Platform)

2K $–4K $/мес
Опубликовано 12.03.2026

О позиции

Мы ищем Data Engineer для работы на удалёнке в Узбекистане, который поможет построить современную Lakehouse/Data Platform для миллионов пользователей. Эта роль требует глубоких знаний в области обработки данных и разработки пайплайнов, что позволит вам внести значительный вклад в наш продукт.

Чем вы будете заниматься

  • Разрабатывать ingestion/CDC пайплайны (Debezium/Flink CDC) и доводить их до production-качества: ретраи, дедупликация, DLQ, мониторинг lag’ов.
  • Строить batch-пайплайны на Spark и выкладывать данные в Iceberg (Bronze/Silver/Gold), поддерживать schema evolution и бороться с мелкими файлами.
  • Разрабатывать и поддерживать трансформации в dbt: staging/intermediate/marts, инкрементальные модели, тесты, документация и lineage.
  • Оптимизировать запросы/витрины под Trino (партиционирование, статистики, cost-based оптимизации), при необходимости — выносить агрегаты.
  • Прорабатывать модель данных и контракты с продуктами (Clickstream / Search / RecSys) и прикладными командами.
  • Встраивать качество, каталогизацию и доступы: DataHub, правила OPA, ожидания Great Expectations.
  • Участвовать в эксплуатации: алерты, метрики, SLO/SLA, разбор инцидентов, runbooks.

Требования

  • Сильный Python.
  • Опыт со Spark (PySpark; Scala/Java — большой плюс).
  • Понимание lakehouse подхода и работы табличных форматов.
  • Опыт с Kafka, понимание CDC.
  • Практика Airflow и/или dbt в реальных проектах.
  • Умение думать про надежность: идемпотентность, exactly-once/at-least-once, обработка ошибок, backfill.
  • Опыт с Trino/Presto, настройкой и оптимизацией аналитических запросов.
  • Опыт со Flink/Spark (stream processing, event time, state, checkpoints).
  • Понимание DataHub/lineage и Data Quality фреймворков.
  • Опыт Kubernetes/Helm и взаимодействия с DevOps.

Стек

  • Storage: S3 + Apache Iceberg
  • Batch processing: Spark/Trino/Flink
  • Streaming: Apache Kafka + Apache Flink + Apache Spark
  • CDC/ingestion: Debezium, Flink CDC
  • Orchestration: Apache Airflow (Kubernetes Executor)
  • Transformations/marts: dbt Core
  • Query layer: Trino
  • Data Quality: dbt tests, Great Expectations
  • Infra: Kubernetes, Helm, ArgoCD, облако

Что мы предлагаем

  • Конкурентная зарплата и возможность работать удалённо.
  • Участие в разработке продукта, который будет использоваться миллионами пользователей.
  • Доступ к современным технологиям и инструментам.
  • Возможности для профессионального роста и развития.
  • Гибкий график работы.
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
7.5
7.5 из 10
оценка совпадения

Вакансия предлагает интересные задачи и конкурентную зарплату, однако отсутствует информация о компании.

Требования к языку
RussianC1
English(опционально)B2
БазовыйСреднийПродвинутыйРодной

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка Python 2026
$15B
Годовой рост
10.2%
Внедрение AI
45%
Инвестиции в Data Engineering
+200%

Навыки и требования

Обязательные
PythonSparkKafka
Растущий спрос
Machine LearningData WarehousingCloud Computing (AWS, Azure)
Снижающийся спрос
HadoopTraditional ETL Tools

Тренды отрасли

Интеграция Lakehouse
Модели Lakehouse становятся всё более популярными среди компаний, так как они объединяют возможности хранения данных и аналитики, увеличивая эффективность работы с данными на 35%.
Автоматизация процессов ETL
Системы автоматизации ETL, такие как Airflow и dbt, становятся стандартом в индустрии, что позволяет сократить время обработки данных на 40%.

Новости Data Engineering

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев

Похожие вакансии
Digital Product Owner для вклада и накопительных счетов
Wildberries Банк·300K ₽–500K ₽
AI Visual Creator для создания фотореалистичных изображений
110K ₽–180K ₽
QA-инженер — JIRA — проектов в Digital Products
Цифровые привычки·190K ₽–230K ₽
Проджект-менеджер для отдела Business Operations
Dream Offer·4K ₽–5K ₽
Middle/Senior PHP Backend-разработчик — Symfony и микросервисы
5K ₽
Performance Аналитик — нагрузочное тестирование в финтех
Vadarod·4K ₽–10K ₽
Авитолог — оптимизация объявлений на Avito
110K ₽–180K ₽
Integration Manager — API
IREV·49 ₽–87 ₽
Бизнес-системный аналитик — оптимизация процессов для крипто-брокеров
CompanionVille·180K ₽–320K ₽
QA-инженер — Java — проектов в B2B SaaS
Caterpillar·6K ₽–6K ₽
Системный аналитик — работа в финтехе
PayDepot·200K ₽–300K ₽
QA-инженер — ClickHouse
235K ₽
Тестировщик-автоматизатор на Python — развитие тестового фреймворка
IT People group·170K ₽–200K ₽
Retention Marketing Manager — управление удержанием пользователей
Ayni Gold·110K ₽–180K ₽
Tech Lead / Senior Fullstack Engineer — blockchain и Web3 решения
Interexy·300K ₽–500K ₽