ITLT
ITLT
New

Senior Data Architect

Brak informacji o wynagrodzeniu
SeniorFull-time·B2B
#378957·Dodano dziś·0
Źródło: ITLT
Aplikuj teraz

Tech Stack / Keywords

DatabricksGCPApache SparkUnityETLSQLCI/CDDevOps

Firma i stanowisko

W ITLT pomagamy naszym zaprzyjaźnionym firmom przekształcać ambitne pomysły w cyfrową rzeczywistość. Z nastawieniem na wyzwania, ciekawość technologii i zwinność współtworzymy wyjątkowe rozwiązania IT i zapewniamy doświadczone osoby eksperckie, które pomagają przyspieszać cyfrową transformację.

Wymagania

  • Minimum 10 lat doświadczenia w obszarze Inżynierii Danych lub Architektury Danych z naciskiem na budowę skalowalnych platform.
  • Mocne, praktyczne doświadczenie w pracy z platformą Databricks (najchętniej na GCP) oraz ekosystemem Apache Spark (tworzenie potoków danych w PySpark/Scala oraz Delta Lake).
  • Solidne doświadczenie w pracy z nowoczesnymi chmurami danych (preferowane GCP, ew. AWS/Azure) oraz mechanizmami przechowywania danych (GCP Storage).
  • Silne umiejętności w zakresie optymalizacji baz wektorowych i modeli embeddingowych wspierających systemy RAG i integracje LLM.
  • Biegła znajomość zaawansowanego SQL (optymalizacja złożonych zapytań) oraz koncepcji hurtowni danych.
  • Doskonałe umiejętności komunikacyjne – potrafisz klarownie zaprezentować wizję architektoniczną technicznym deweloperom i biznesowym decydentom.

Nice to have:

  • Certyfikacja: Databricks Certified Data Engineer Professional lub Associate.
  • Praktyczna znajomość narzędzi do przetwarzania strumieniowego/Big Data: Apache Kafka, GCP Pub/Sub, Apache Airflow.
  • Doświadczenie w podejściu Infrastructure-as-Code z użyciem Terraform.
  • Znajomość nowoczesnych narzędzi BI (np. Looker Studio, Power BI).

Obowiązki

  • Projektowanie i nadzór nad docelową architekturą w modelu Lakehouse, z wykorzystaniem technologii Delta Lake oraz Apache Spark.
  • Zarządzanie bezpieczeństwem, katalogowaniem danych i dostępami (fine-grained access controls) za pomocą Databricks Unity Catalog.
  • Optymalizacja i strojenie wydajności potoków danych (ETL), klastrów oraz zapytań Databricks SQL w celu obniżenia kosztów i poprawy czasu przetwarzania.
  • Integracja procesów Databricks w ramach pipeline'ów CI/CD przy użyciu praktyk DevOps i środowiska Git (GitLab).
  • Współpraca z analitykami dziedzinowymi, zespołami data science i właścicielami produktów w celu przekładania wymagań na stabilne rozwiązania architektoniczne i potoki danych.
  • Projektowanie mechanizmów bezpieczeństwa i compliance, m.in. maskowanie danych, szyfrowanie i logowanie audytowe z użyciem Unity Catalog i usług GCP.

Benefity

  • Długofalową współpracę B2B z IT LeasingTeam.
  • Elastyczność pracy w modelu hybrydowym z nowoczesnego biura w Warszawie (dla osób spoza Warszawy – do dogadania).
  • Dostęp do benefitów - Multisport, PZU, LuxMed.
  • Przejrzysty kontakt z rekruterem ITLT, dzięki czemu zawsze wiesz, na jakim etapie procesu jesteś.
Elastyczne godziny
Karta sportowa
Opieka zdrowotna
Ubezpieczenie

Inne informacje

Forma współpracy: Kontrakt B2B (bezpośrednio z IT LeasingTeam). Tryb Pracy: Hybrydowy – preferowana obecność 1 raz w tygodniu w biurze w Warszawie. Wymiar pracy: Full-time (współpraca długoterminowa), standardowe polskie godziny pracy. Dostępność: ASAP lub zgodnie z okresem wypowiedzenia. Podróże służbowe: Sporadyczne (ok. 10% czasu) – głównie w obszarze Europy.

ITLT

ITLT

150 aktywnych ofert

Zobacz wszystkie oferty
Aplikuj teraz