Senior Data Architect
Brak informacji o wynagrodzeniu
SeniorFull-time·B2B
#378957·Dodano dziś·0
Źródło: ITLTTech Stack / Keywords
DatabricksGCPApache SparkUnityETLSQLCI/CDDevOps
Firma i stanowisko
W ITLT pomagamy naszym zaprzyjaźnionym firmom przekształcać ambitne pomysły w cyfrową rzeczywistość. Z nastawieniem na wyzwania, ciekawość technologii i zwinność współtworzymy wyjątkowe rozwiązania IT i zapewniamy doświadczone osoby eksperckie, które pomagają przyspieszać cyfrową transformację.
Wymagania
- Minimum 10 lat doświadczenia w obszarze Inżynierii Danych lub Architektury Danych z naciskiem na budowę skalowalnych platform.
- Mocne, praktyczne doświadczenie w pracy z platformą Databricks (najchętniej na GCP) oraz ekosystemem Apache Spark (tworzenie potoków danych w PySpark/Scala oraz Delta Lake).
- Solidne doświadczenie w pracy z nowoczesnymi chmurami danych (preferowane GCP, ew. AWS/Azure) oraz mechanizmami przechowywania danych (GCP Storage).
- Silne umiejętności w zakresie optymalizacji baz wektorowych i modeli embeddingowych wspierających systemy RAG i integracje LLM.
- Biegła znajomość zaawansowanego SQL (optymalizacja złożonych zapytań) oraz koncepcji hurtowni danych.
- Doskonałe umiejętności komunikacyjne – potrafisz klarownie zaprezentować wizję architektoniczną technicznym deweloperom i biznesowym decydentom.
Nice to have:
- Certyfikacja: Databricks Certified Data Engineer Professional lub Associate.
- Praktyczna znajomość narzędzi do przetwarzania strumieniowego/Big Data: Apache Kafka, GCP Pub/Sub, Apache Airflow.
- Doświadczenie w podejściu Infrastructure-as-Code z użyciem Terraform.
- Znajomość nowoczesnych narzędzi BI (np. Looker Studio, Power BI).
Obowiązki
- Projektowanie i nadzór nad docelową architekturą w modelu Lakehouse, z wykorzystaniem technologii Delta Lake oraz Apache Spark.
- Zarządzanie bezpieczeństwem, katalogowaniem danych i dostępami (fine-grained access controls) za pomocą Databricks Unity Catalog.
- Optymalizacja i strojenie wydajności potoków danych (ETL), klastrów oraz zapytań Databricks SQL w celu obniżenia kosztów i poprawy czasu przetwarzania.
- Integracja procesów Databricks w ramach pipeline'ów CI/CD przy użyciu praktyk DevOps i środowiska Git (GitLab).
- Współpraca z analitykami dziedzinowymi, zespołami data science i właścicielami produktów w celu przekładania wymagań na stabilne rozwiązania architektoniczne i potoki danych.
- Projektowanie mechanizmów bezpieczeństwa i compliance, m.in. maskowanie danych, szyfrowanie i logowanie audytowe z użyciem Unity Catalog i usług GCP.
Benefity
- Długofalową współpracę B2B z IT LeasingTeam.
- Elastyczność pracy w modelu hybrydowym z nowoczesnego biura w Warszawie (dla osób spoza Warszawy – do dogadania).
- Dostęp do benefitów - Multisport, PZU, LuxMed.
- Przejrzysty kontakt z rekruterem ITLT, dzięki czemu zawsze wiesz, na jakim etapie procesu jesteś.
Elastyczne godziny
Karta sportowa
Opieka zdrowotna
Ubezpieczenie
Inne informacje
Forma współpracy: Kontrakt B2B (bezpośrednio z IT LeasingTeam). Tryb Pracy: Hybrydowy – preferowana obecność 1 raz w tygodniu w biurze w Warszawie. Wymiar pracy: Full-time (współpraca długoterminowa), standardowe polskie godziny pracy. Dostępność: ASAP lub zgodnie z okresem wypowiedzenia. Podróże służbowe: Sporadyczne (ok. 10% czasu) – głównie w obszarze Europy.
ITLT
150 aktywnych ofert