Data Engineer (Senior)
do 165 PLN/ godz.B2B (netto)
SeniorFull-time·B2B
#320919·Dodano dwa miesiące temu·26
Źródło: Scalo🚫Oferta wygasła. Ta oferta pracy nie jest już aktywna i rekrutacja została zakończona.
Tech Stack / Keywords
GCPETLKafkaREST APIPythonPySparkRust
Firma i stanowisko
W Scalo zajmujemy się dostarczaniem projektów software'owych i wspieraniem naszych partnerów w rozwijaniu ich biznesu. Tworzymy oprogramowanie, które umożliwia ludziom dokonywanie zmian, działanie w szybszym tempie oraz osiąganie lepszych rezultatów. Jesteśmy firmą, która wykorzystuje szerokie spektrum usług IT, żeby pomagać klientom.
Obszary naszego działania to m.in.: doradztwo technologiczne, tworzenie oprogramowania, systemy wbudowane, rozwiązania chmurowe, zarządzanie danymi, dedykowane zespoły developerskie.
Wymagania
- masz co najmniej 5-letnie doświadczenie jako Data Engineer GCP w obszarze procesów integracji danych na GCP
- bardzo dobrze znasz bazy danych GCP: GCP Big Query, GCP Big Table, Scylla Cloud
- dobrze znasz narzędzia ETL Flow na GCP: Apache AirFlow, GCP Data Flow, GCP Data Proc
- korzystasz z kolejek Kafka oraz GCP Pub / Sub
- masz co najmniej 4-letnie doświadczenie jako Developer ETL w obszarze procesów integracji danych on-prem
- biegle posługujesz się narzędziami ETL on-prem na poziomie zaawansowanym: Informatica Power Center, NIFI
- posiadasz ekspercką znajomość relacyjnych baz danych Oracle, PostgreSQL, ScyllaDB
- bardzo dobrze znasz narzędzie harmonogramujące Automate Now firmy Infinity Data
- potrafisz wystawiać usługi Rest API
- masz co najmniej 3-letnie doświadczenie jako programista
- biegle znasz Python w obszarze integracji i analizy danych oraz framework PySpark
- znasz język Rust do pisania narzędzi i frameworków wspomagających wydajne ładowanie danych
Nice to have:
- podstawowa wiedza w zakresie programowania MicroServices w języku JAVA
- korzystanie z systemu operacyjnego Linux na poziomie zaawansowanego użytkownika
- doświadczenie w pracy z dużymi wolumenami danych ~100TB
- umiejętności analitycznego myślenia i szybkiego przyswajania wiedzy
- samodzielność i kreatywność w rozwiązywaniu problemów
- terminowość i rzetelność w realizacji projektów
- znajomość narzędzi pomocniczych: repozytorium GIT, narzędzi do monitorowania jak np. Grafana, narzędzi do testów wydajności jak Apache JMeter
Obowiązki
- praca w obszarze procesów integracji danych na GCP
- praca w obszarze procesów integracji danych on-prem
- projektowanie, budowa i tuning baz danych
- korzystanie z narzędzi ETL na GCP i on-prem
- korzystanie z kolejek Kafka oraz GCP Pub / Sub
- wystawianie usług Rest API
- praca w języku Python oraz z frameworkiem PySpark
- wykorzystanie języka Rust do pisania narzędzi i frameworków wspomagających wydajne ładowanie danych
- z czasem przejęcie odpowiedzialności za wybrany obszar przetwarzania i wystawiania danych pod usługi w wysokim reżimie wydajnościowym
- praca w modelu hybrydowym 1 raz w tygodniu z biura w Warszawie
Oferta
- Stabilną współpracę i różnorodne projekty (Software, Embedded, Data, Cloud Services)
- możliwość rozwoju kompetencji jako Ambasador Scalo - doskonal skille techniczne i presalesowe w społeczności naszych ekspertów, wpływaj na rozwój organizacji, wspieraj innych
- przestrzeń do budowania marki osobistej - twórz wartościowe treści, dziel się wiedzą i doświadczeniem, występuj jako prelegent na wydarzeniach (np. ProMeet)
- prywatną opiekę medyczną - Luxmed
- kafeteryjny system benefitów - Motivizer
- dostęp do karty Multisport
- program poleceń pracowniczych z nagrodami
- integracje i wydarzenia firmowe
Opieka zdrowotna
Karta sportowa
Dofinansowanie szkoleń
Spotkania integracyjne
Scalo
588 aktywnych ofert