О позиции
Мы ищем Data Engineer для проектной работы в компании Top Selection. Эта позиция предлагает возможность работать с передовыми технологиями в области больших данных. Вы будете частью команды, занимающейся разработкой и поддержкой интеграционных потоков, а также потоков сборки витрин-данных. Если вы хотите развиваться в области Data Engineering и работать с такими технологиями, как Trino, Spark и Apache Airflow, эта вакансия для вас!
Чем вы будете заниматься
- Сбор требований с бизнес-заказчиков и анализ источников данных.
- Разработка, реализация и поддержка интеграционных потоков на стеке технологий, принятых в команде.
- Оперативное реагирование на информацию о проблемах в зоне ответственности.
- Поддержание актуальности документации типовых интеграционных решений.
- Предоставление отчетности о своей деятельности руководителю.
Требования
- Знание SQL (индексы, функции, оптимизация, профилирование производительности).
- Опыт работы с реляционными БД (Oracle, Postgres, MySQL, MsSQL и т.п.).
- Умение работать с Git (знание команд git pull/commit/push).
- Опыт разработки на Spark.
- Понимание особенностей Trino и форматов данных Iceberg, Parquet, Avro.
- Опыт работы с системами ведения проектов и документации.
Будет плюсом
- Опыт работы с DBT, Cosmos, Ni-Fi.
- Общее представление о стеке технологий Lakehouse.
- Понимание различия работы между Big Data и данными обычного размера.
Что мы предлагаем
- Конкурентная зарплата от 256К до 280К.
- Долгосрочный проект с возможностью профессионального роста.
- Работа в команде профессионалов с современными технологиями.
- Оформление только через ИП.
- Фуллтайм загрузка.
Вакансия предлагает конкурентную зарплату и возможность работы с современными технологиями в области больших данных. Однако, информация о компании ограничена, что может вызвать вопросы у кандидатов.
Кто здесь добьётся успеха
Глубокое понимание работы с Greenplum и Clickhouse для эффективного проектирования хранилищ данных и выполнения сложных запросов.
Способность к самоорганизации и управлению временем, что особенно важно при удаленной работе, где требуется высокая степень ответственности и самодисциплины.
Опыт работы с Apache Airflow для автоматизации ETL процессов и интеграции данных, что позволяет сократить время на обработку данных и улучшить их качество.
Ресурсы для обучения
Карьерный путь
Обзор рынка
Навыки и требования
Тренды отрасли
Новости Big Data
Загружаем новости отрасли...
Ищем релевантные статьи за последние 6 месяцев