DataDrill traži Data Engineer-a sa full-stack background-om
Tražimo inženjera koji se vremenom razvija ka data engineering ulozi, ali u prvih nekoliko meseci može aktivno da doprinosi razvoju naše postojeće platforme kao full-stack developer.
Konkretno: u startu radiš na našem aktivnom projektu (React/Node.js stack) gde nam treba pojačanje za održavanje i razvoj. Paralelno se uključuješ u rad sa podacima ETL pipeline-i, modelovanje, integracije izvora i u trenutku kada krene novi data-heavy projekat, prelaziš na njega kao primarni data engineer.
Ovo nije pozicija za nekoga ko želi da ostane „samo full-stack". Tražimo inženjera koji ima solidno backend/frontend iskustvo, ali ga sve više zanima sloj ispod aplikacije, kako podaci dolaze, kako se transformišu, kako se modeliraju i serviraju analitičkim i AI sistemima.
Pozicija
- Data Engineer (sa full-stack background-om), 3–5 godina iskustva
Tehnologije i platforma
- Frontend: React, Redux, Next.js, TypeScript, HTML, CSS, JavaScript
- Backend: Node.js (NestJS), REST API-jevi, GraphQL
- Data processing: Python (pandas, NumPy, SQLAlchemy), napredni SQL, PySpark
- Pipeline orkestracija: Apache Airflow, Azure Data Factory, dbt
- Data warehousing & modelovanje: Azure Synapse, Snowflake, BigQuery, Databricks, Microsoft Fabric, dimensional modeling (star schema, Data Vault), medallion arhitektura
- Streaming & messaging: Apache Kafka, event-driven obrada
- Baze podataka: PostgreSQL, MongoDB, MSSQL, Delta tables
- Cloud & DevOps: Azure, AWS ili GCP, Docker, Kubernetes, Terraform, CI/CD alati (GitLab, Azure DevOps)
- AI/ML data layer (plus): Vector databases, embeddings, RAG pipeline-i, LangChain/LangGraph
Opis posla
- Razvoj i održavanje ETL/ELT pipeline-a koji unifikuju podatke iz raznorodnih izvora (REST API, PDF, CSV, XML/JSON, baze podataka, custom crawlers)
- Modelovanje podataka — dimensional modeling, star schemas, medallion arhitektura (Bronze/Silver/Gold), custom SQL view-ovi za analitičke i AI use-case-ove
- Orkestracija pipeline-a kroz Apache Airflow, Azure Data Factory ili dbt, sa logging-om, schema versioning-om i data lineage-om
- Optimizacija performansi upita, dizajn šeme baze i query tuning
- Saradnja sa AI/ML inženjerima na pripremi podataka za RAG i SQL agente — embeddings, vector search, izgradnja knowledge layer-a iznad strukturiranih podataka
- U inicijalnoj fazi: održavanje i nadogradnja postojeće klijentske platforme — rešavanje bugova, razvoj novih feature-a, uklanjanje tehničkog duga
- Učestvovanje u arhitekturnim odlukama na novim data-heavy projektima
Šta očekujemo od kandidata
- 3–5 godina iskustva u software development-u, sa praktičnim iskustvom i u backend razvoju i u radu sa podacima
- Solidno poznavanje JavaScript/TypeScript ekosistema (React, Node.js) — dovoljno da budeš produktivan na full-stack zadacima od prvog meseca
- Solidno iskustvo u radu sa Python-om za data processing (pandas, NumPy, SQLAlchemy ili slično)
- Praktično iskustvo sa ETL pipeline alatima i orkestracijom (Apache Airflow, Azure Data Factory, dbt ili sličnim)
- Napredno poznavanje SQL-a — CTE, window funkcije, query optimizacija, modelovanje šeme
- Razumevanje koncepata data warehouse-a i dimensional modeling-a (fact/dimension tabele, star/snowflake schema)
- Razumevanje rada sa relacionim bazama (PostgreSQL) i osnova rada u cloud okruženju (Azure, AWS ili GCP)
- Spremnost za timski rad, jasnu komunikaciju sa kolegama i klijentima, i proaktivnost u rešavanju problema
- Jasan interes za specijalizaciju ka data engineering ulozi
Plus (nije obavezno, ali je prednost):
- Iskustvo sa Snowflake, BigQuery, Databricks, Microsoft Fabric ili sa PySpark / Spark SQL
- Iskustvo sa medallion arhitekturom (Bronze/Silver/Gold), Delta tables i dbt-om
- Iskustvo sa streaming pipeline-ima (Apache Kafka, Kinesis, Pub/Sub)
- Rad sa vector databases, embeddings, RAG pipeline-ima ili LangChain/LangGraph framework-ima
- Iskustvo sa Power BI, Looker ili sličnim BI alatima za serviranje podataka
- Iskustvo sa Kubernetes-om, Terraform-om ili infrastrukturom kao kod
- Iskustvo sa Python backend framework-ima (FastAPI, Django)
- Iskustvo u life-sciences, healthcare ili drugim regulisanim industrijama
Šta nudimo
- Rad na internacionalnim projektima u industriji koja ima stvaran uticaj (life sciences & healthcare)
- Jasan razvojni put ka data engineering specijalizaciji
- Kombinaciju rada na postojećim rešenjima i razvoju novih sa modernim tehnologijama
- Mogućnost rada sa AI/ML alatima i savremenim data stack-om (Airflow, Azure Synapse, Microsoft Fabric, RAG)
- Saradnju sa senior inženjerima i mogućnost profesionalnog razvoja
- Fleksibilno radno vreme i hibridni rad
- Otvorenu komunikaciju i podršku tima