Cemal Cici

Kıdemli Veri Mühendisi

Modern veri platformları ve veri ambarı çözümleri tasarlama ve geliştirme konusunda 3+ yıl deneyime sahip bir Büyük Veri Mühendisiyim. Python, PySpark, Hive ve Iceberg/Delta Lake konularında uzmanlaşmış olup Airflow, dbt ve SQLMesh kullanarak ölçeklenebilir ETL/ELT iş akışları geliştiriyorum. Analitik ve raporlama alanında PostgreSQL, Trino ve Power BI deneyimim bulunmaktadır. Odak noktam; güvenilir veri hatları oluşturmak, dağıtımları otomatikleştirmek ve ML ile büyük veri iş yüklerini modern veri gölü mimarilerine entegre etmektir.

Deneyim

Kıdemli Veri Mühendisi

Bentego

Ankara, Türkiye (Uzaktan)

Nis 2026 – Günümüz

Büyük Veri Mühendisi

Treomind

Ankara, Türkiye (Hibrit)

Nis 2023 – Mar 2026
  • Python, PySpark, Hive ve Iceberg/Delta Lake kullanarak iş birimi odaklı kurumsal BI/DWH veri mimarileri tasarlandı ve hayata geçirildi
  • PostgreSQL, Oracle SQL, MSSQL ve Trino/Nessie üzerinde raporlama ve analitik için ilişkisel ve boyutsal veri modelleri ile veri reyonları oluşturuldu
  • Airflow, dbt ve SQLMesh kullanılarak yüksek hacimli ortamlarda ETL/ELT iş akışları orkestre edildi ve versiyonlandı
  • Power BI ve Apache Superset üzerinde operasyonel gösterge panelleri ve self-servis veri katmanları yayımlandı
  • Geçici sorgu ve analist odaklı sorgu performansını artırmak için DuckDB ve MinIO (S3 uyumlu) üzerinde hızlı okuma katmanları kuruldu
  • Mevcut veritabanı şemaları için bölümleme, indeksleme ve uygun dosya formatı (Parquet/Iceberg/Delta) stratejileri belirlendi ve uygulandı
  • HPE Ezmeral Data Fabric üzerinde meta veri odaklı, modüler bir PySpark ETL/ELT çerçevesi geliştirildi ve merkezi olarak yönetildi
  • Apache Iceberg + Nessie ile versiyonlu tablolar, Dev–Prod dal yönetimi ve otomatik bakım süreçleri etkinleştirildi
  • Artımlı yükleme, idempotent çalıştırma, dinamik bölümleme ve kasa tabanlı gizli yönetimi ile kurumsal ölçekte sürdürülebilir veri akışları oluşturuldu
  • PostgreSQL DWH/STG şemaları Iceberg katmanıyla senkronize edilerek standart şablonlarla DIM/FACT yapıları üretildi
  • GitHub Actions, Argo CD ve konteyner tabanlı dağıtımlar kullanılarak Spark/ETL işleri otomatik olarak paketlendi ve güvenli biçimde iletildi
  • Kubernetes üzerinde Trino, Nessie ve benzer veri servislerinin konteyner tabanlı dağıtımı, ölçeklenmesi ve servis keşfi yönetildi
  • HPE Ezmeral Data Fabric üzerinde Apache Spark kümeleri yapılandırıldı, kaynak/rol politikaları uygulandı ve büyük veri iş yükleri için performans testleri gerçekleştirildi
  • Ezmeral platformunda veri yönetişimi, kullanıcı/rol tabanlı erişim denetimi ve servis düzeyi yapılandırma politikaları hayata geçirildi
  • Azure ML Studio ve Python SDK ile geliştirilen modeller için üretime yönelik ETL/ELT veri hatları tasarlandı ve otomatik olarak dağıtıldı
  • Model kayıt defteri, deney takibi ve çevrimiçi model servislerini ölçeklenebilir kılmak için MLflow, Airflow, MinIO ve FastAPI/SQLModel entegre edildi
  • Spark on Kubernetes kullanılarak HPE Runtime MLOps platformunda uçtan uca ML süreçleri büyük veri iş yükleriyle entegre edildi
Python PySpark Hive Iceberg Delta Lake Airflow dbt SQLMesh PostgreSQL Trino Nessie Kubernetes Docker GitHub Actions Argo CD MinIO DuckDB Power BI Apache Superset Azure ML MLflow FastAPI

Veri Bilimcisi

Serbest

Ankara, Türkiye (Uzaktan)

Tem 2022 – Mar 2023
  • Bireysel emeklilik ve hayat sigortası alanlarında geçici veri analizi görevleri gerçekleştirildi
  • SQL ve Python tabanlı veri hazırlama yoluyla tekrarlayan raporlar kısmen otomatikleştirildi
  • IBM SPSS Modeler iş akışları daha iyi sürdürülebilirlik için Python ve SQL'e taşındı
  • Analitik içgörüler için poliçe, müşteri ve ödeme verileri entegre edilerek ön işleme tabi tutuldu
Python SQL IBM SPSS Modeler

Veri Bilimi Bootcamp Katılımcısı ve Gönüllü Mentor

Veri Bilimi Okulu

Ankara, Türkiye (Uzaktan)

Nis 2020 – Tem 2021
  • Veri işleme ve görselleştirme görevleri için Python, SQL ve Power BI eğitimi alındı
  • CRM analitiği, A/B testi ve temel öneri sistemleri konularında proje bazlı uygulamalar tamamlandı
  • Özellik mühendisliği ve model eğitimi ile makine öğrenmesi hatları hayata geçirildi
  • Kavram pekiştirme ve iş birliğini desteklemek amacıyla akran mentoru olarak gönüllülük yapıldı
Python SQL Power BI

Eğitim

Yüksek Lisans - Bilişim Sistemleri

Gazi Üniversitesi

Ankara, Türkiye

2025 – Devam Ediyor

Lisans - Endüstri Mühendisliği (GNO: 3,0/4,0)

Karabük Üniversitesi

Karabük, Türkiye

2013 – 2018

Beceriler

Programlama & Betik Dilleri
Python SQL Bash Script
ETL/ELT & Veri İşleme
PySpark Pandas Polars dbt SQLMesh SSIS ODI
Büyük Veri Platformu
Apache Hadoop (HDFS, YARN) Apache Hive Apache Spark Apache Airflow Apache Kafka HPE Ezmeral Data Fabric MinIO Trino Nessie
Veritabanları
PostgreSQL Oracle SQL MSSQL SQLite DuckDB
BI & Raporlama
Power BI Apache Superset OBI
Data/MLOps & DevOps
Docker Kubernetes GitHub Actions Argo CD Linux MLflow FastAPI HPE Ezmeral Runtime Enterprise HPE Ezmeral Unified Analytics
Bulut
Azure ML Studio Microsoft Fabric MinIO (S3 uyumlu)
Kavramlar
Veri Ambarı Boyutsal Modelleme Veri Gölü Veri Gölü Evi Modern Veri Ambarı DataOps MLOps

Sertifikalar

  • Microsoft Certified: Fabric Data Engineer Associate

    Microsoft · Haz 2025

  • dbt Fundamentals

    dbt Labs · Kas 2023

  • A'dan Z'ye Docker

    Udemy · Nis 2023

Diller

  • Türkçe Anadil
  • İngilizce Orta Seviye (B1)