Lokalizacja: praca zdalna / hybrydowa
Język: angielski – wymagany poziom min. B2
Szukamy Senior Data Engineera, który poprowadzi rozwój skalowalnych Data Hubów, wspierających potrzeby analityczne, raportowe, operacyjne oraz zastosowania w obszarze Generative AI.
To rola dla osoby, która chce mieć realny wpływ na strategię danych organizacji – poprzez tworzenie wzorców architektonicznych, wdrażanie najlepszych praktyk inżynierskich oraz mentoring młodszych członków zespołu.
- Projektowanie architektury Data Hubów – integracja danych strukturalnych i niestrukturalnych z wielu źródeł.
- Definiowanie standardów, wzorców projektowych i najlepszych praktyk inżynierskich.
-
Mentoring i wsparcie techniczne dla innych inżynierów danych (code review, dzielenie się wiedzą).
- Tworzenie i optymalizacja przepływów danych (batch i real-time).
- Wdrażanie mechanizmów walidacji danych, detekcji anomalii oraz automatycznego monitoringu.
-
Automatyzacja procesów i zapewnienie płynnego wdrażania dzięki CI/CD.
- Bliska współpraca z architektami, zespołami AI oraz stroną biznesową.
- Zapewnienie zgodności z zasadami bezpieczeństwa, governance i regulacjami.
- Tworzenie i utrzymywanie wysokiej jakości dokumentacji technicznej.
- Bardzo dobra znajomość Python i SQL.
- Doświadczenie w pracy z Azure (Data Factory, ADLS, Azure SQL, Synapse).
-
Biegłość w Databricks (główne narzędzie) i Apache Spark.
- Umiejętność projektowania skalowalnych platform danych na poziomie enterprise.
- Doświadczenie z przetwarzaniem danych w czasie rzeczywistym (Azure Stream Analytics, Event Hubs).
- Wiedza z zakresu DevOps, CI/CD, Terraform, Docker, Kubernetes/AKS.
- Znajomość zasad Data Governance, bezpieczeństwa danych i zgodności z regulacjami.
- Doświadczenie w prowadzeniu zespołów technicznych i mentoringu.
- Bardzo dobre umiejętności komunikacyjne i dokumentacyjne.
-
Angielski na poziomie min. B2 (w mowie i piśmie).
-
Platformy danych: Databricks, Apache Spark, Delta Lake
-
Chmura i usługi danych: Azure Data Factory, ADLS, Azure SQL, Synapse, Azure DevOps
-
Real-time streaming: Azure Stream Analytics, Azure Event Hubs
-
Automatyzacja i rozwój: Python, SQL, GitHub, Terraform, Docker, Kubernetes/AKS