Senior Data Architect

Brak informacji o wynagrodzeniu

SeniorFull-time·B2B

#378957·Dodano 24 dni temu·0

Źródło: ITLT

Aplikuj teraz

Tech Stack / Keywords

DatabricksGCPApache SparkUnityETLSQLCI/CDDevOps

Firma i stanowisko

W ITLT pomagamy naszym zaprzyjaźnionym firmom przekształcać ambitne pomysły w cyfrową rzeczywistość. Z nastawieniem na wyzwania, ciekawość technologii i zwinność współtworzymy wyjątkowe rozwiązania IT i zapewniamy doświadczone osoby eksperckie, które pomagają przyspieszać cyfrową transformację.

Wymagania

Minimum 10 lat doświadczenia w obszarze Inżynierii Danych lub Architektury Danych z naciskiem na budowę skalowalnych platform.
Mocne, praktyczne doświadczenie w pracy z platformą Databricks (najchętniej na GCP) oraz ekosystemem Apache Spark (tworzenie potoków danych w PySpark/Scala oraz Delta Lake).
Solidne doświadczenie w pracy z nowoczesnymi chmurami danych (preferowane GCP, ew. AWS/Azure) oraz mechanizmami przechowywania danych (GCP Storage).
Silne umiejętności w zakresie optymalizacji baz wektorowych i modeli embeddingowych wspierających systemy RAG i integracje LLM.
Biegła znajomość zaawansowanego SQL (optymalizacja złożonych zapytań) oraz koncepcji hurtowni danych.
Doskonałe umiejętności komunikacyjne – potrafisz klarownie zaprezentować wizję architektoniczną technicznym deweloperom i biznesowym decydentom.

Nice to have:

Certyfikacja: Databricks Certified Data Engineer Professional lub Associate.
Praktyczna znajomość narzędzi do przetwarzania strumieniowego/Big Data: Apache Kafka, GCP Pub/Sub, Apache Airflow.
Doświadczenie w podejściu Infrastructure-as-Code z użyciem Terraform.
Znajomość nowoczesnych narzędzi BI (np. Looker Studio, Power BI).

Obowiązki

Projektowanie i nadzór nad docelową architekturą w modelu Lakehouse, z wykorzystaniem technologii Delta Lake oraz Apache Spark.
Zarządzanie bezpieczeństwem, katalogowaniem danych i dostępami (fine-grained access controls) za pomocą Databricks Unity Catalog.
Optymalizacja i strojenie wydajności potoków danych (ETL), klastrów oraz zapytań Databricks SQL w celu obniżenia kosztów i poprawy czasu przetwarzania.
Integracja procesów Databricks w ramach pipeline'ów CI/CD przy użyciu praktyk DevOps i środowiska Git (GitLab).
Współpraca z analitykami dziedzinowymi, zespołami data science i właścicielami produktów w celu przekładania wymagań na stabilne rozwiązania architektoniczne i potoki danych.
Projektowanie mechanizmów bezpieczeństwa i compliance, m.in. maskowanie danych, szyfrowanie i logowanie audytowe z użyciem Unity Catalog i usług GCP.

Benefity

Długofalową współpracę B2B z IT LeasingTeam.
Elastyczność pracy w modelu hybrydowym z nowoczesnego biura w Warszawie (dla osób spoza Warszawy – do dogadania).
Dostęp do benefitów - Multisport, PZU, LuxMed.
Przejrzysty kontakt z rekruterem ITLT, dzięki czemu zawsze wiesz, na jakim etapie procesu jesteś.

Elastyczne godziny

Karta sportowa

Opieka zdrowotna

Ubezpieczenie

Inne informacje

Forma współpracy: Kontrakt B2B (bezpośrednio z IT LeasingTeam). Tryb Pracy: Hybrydowy – preferowana obecność 1 raz w tygodniu w biurze w Warszawie. Wymiar pracy: Full-time (współpraca długoterminowa), standardowe polskie godziny pracy. Dostępność: ASAP lub zgodnie z okresem wypowiedzenia. Podróże służbowe: Sporadyczne (ok. 10% czasu) – głównie w obszarze Europy.

ITLT

113 aktywnych ofert

Zobacz wszystkie oferty

Aplikuj teraz