Специалист по сбору PII-документов — автоматизация и исследование@ Handigital

10K ₽–16K ₽/мес
Опубликовано 17.06.2026

О позиции

Мы ищем Специалиста по сбору PII-документов, который будет заниматься созданием корпуса реальных документов, содержащих общедоступные персонально идентифицируемые данные (PII) в различных областях. Ваша задача будет заключаться в сочетании умного desk-research с целенаправленным веб-скрейпингом для поиска, захвата и каталогизации этих данных для последующего анализа.

Чем вы будете заниматься

  • Сбор материалов: реальные наборы данных, отчёты, документы или любые материалы, которые содержат PII (имена, адреса, номера социального страхования, номера медицинских записей, детали аккаунтов и т.д.).
  • Фокус на областях: здравоохранение, финансы и образование.
  • Географический акцент: публикации Северной Америки на данном этапе (государственные порталы, сайты открытых данных, публичные судебные документы, регуляторные раскрытия и т.д.); другие регионы могут быть добавлены позже.
  • Методы: сочетание автоматизированного скрейпинга (Python, BeautifulSoup/Scrapy/Selenium или аналогичные) и классического desk-research для достижения источников, которые трудно автоматизировать.
  • Выходные данные: организованная структура папок плюс таблица/JSON-каталог с указанием названия документа, URL источника, даты доступа, тег домена и краткой заметки о конкретных полях PII, присутствующих в документе.

Критерии приемки

  • Минимум 250 уникальных документов, сбалансированных по трем областям, и все документы должны быть одностраничными с максимальным объёмом 300 слов.
  • Каждая запись должна включать рабочие ссылки на источники и четкие доказательства хотя бы одного поля PII.
  • Не допускается использование платного или незаконно полученного контента — всё должно быть свободно доступно в открытом интернете.
  • Скрипты (если используются) передаются, хорошо прокомментированы и могут быть запущены в стандартной среде Python.

Если у вас есть опыт сбора открытых данных, навигации по государственным порталам и соблюдения норм, при этом находя труднодоступные файлы, мы хотели бы услышать, как вы собираетесь справиться с этой задачей и как быстро сможете предоставить первую партию.

Требования

  • Сбор данных
  • Извлечение данных
  • Управление данными
  • Добыча данных
  • Проверка документов
  • Python
  • Исследования
  • Веб-скрейпинг

Что мы предлагаем

  • Гибкий график работы
  • Возможность удалённой работы
  • Интересные задачи и проекты
  • Доступ к обучающим материалам
  • Конкурентоспособная оплата
Обязательные
0/1
Желательные
0/1
Бонус
0/1
Почему эта вакансия
6.5
6.5 из 10
оценка совпадения

Вакансия предлагает интересные задачи в области сбора данных, но требует значительного опыта в веб-скрейпинге и соблюдении норм. Оплата конкурентоспособная, но не указана конкретная зарплата.

Требования к языку
EnglishC1
БазовыйСреднийПродвинутыйРодной

Формируем профиль успеха...

Анализируем требования вакансии и данные рынка

Обзор рынка

Объём рынка 2026
$5.4B
Годовой рост
15.2%
Внедрение AI
62%
Инвестиции
+120%

Навыки и требования

Обязательные
Data CollectionData ExtractionData Management
Растущий спрос
Машинное обучениеОбработка естественного языка (NLP)Автоматизация процессов (RPA)
Снижающийся спрос
Скрипты на PerlОбработка данных в Excel

Тренды отрасли

Автоматизация сбора данных
Внедрение автоматизированных решений для сбора данных увеличилось на 40% за последние два года, что позволяет компаниям значительно сократить время на обработку информации.
Рост использования AI в анализе данных
62% компаний уже внедрили AI-технологии для улучшения процессов анализа и извлечения данных, что приводит к более точным и быстрым результатам.

Новости Data Privacy

Загружаем новости отрасли...

Ищем релевантные статьи за последние 6 месяцев

Похожие вакансии
Системный инженер — разработка SIEM-систем
Top Selection·280K ₽–316K ₽
Frontend Developer — HTML
Quinncia Inc·200K ₽–300K ₽
AI Product Manager — внедрение AI в внутренние продукты
Corp IT·300K ₽–500K ₽
Android-разработчик — мобильное приложение для Яндекс Crowd
Yandex·200K ₽–300K ₽
Проджект-менеджер для онлайн-школы
Онлайн-школа·180K ₽–320K ₽
Диетолог-специалист — Nutrition
Oshi Health·180K ₽–320K ₽
Менеджер по работе с клиентами
Huntress·180K ₽–320K ₽
Разработчик Android — приложение для управления мультимедиа Lamborghini
Lamborghini·110K ₽–180K ₽
Системный администратор Linux — управление инфраструктурой и контейнерами
РОСГОССТРАХ·180K ₽–320K ₽
Продуктовый дизайнер — инвестиционный проект
Centicore Group·240K ₽–270K ₽
Middle Front-End разработчик — разработка игровой платформы
GGOrbit·507 ₽–764 ₽
Главный аналитик — управление проектами в здравоохранении
ФГБУ «ЦНИИОИЗ»·180K ₽–200K ₽
Разработчик приложения для сбора мобильных контактов
Freelanceroff·3K ₽–21K ₽
Таргетолог для рекламы в TikTok и Google Ads
110K ₽–180K ₽
Data Engineer — разработка промышленных витрин данных
Сбер·180K ₽–320K ₽