Data Engineering Project Bootcamp

Veri Mühendisliği Proje Eğitiminde 6 hafta boyunca katılımcılarla birlikte canlı olarak sıfırdan başlayıp son aşamaya kada uçtan uca bir proje gerçekleştirilir.
Bu proje eğitimi, sektörde uzun yıllar tecrübesi olan birçok veri mühendisinin görüş ve önerileri alınarak titizlikle tasarlandı ve hazırlandı.

Sorularınız ve detaylı bilgi için:  satis@veribilimiokulu.com

Bugün Kayıt Ol!

1. Dönem

Mayıs - Haziran 2025

Pakete Neler Dahil

%100 Canlı Dersler
Canlı Mentor Desteği
Sertifika
Canlı derslerin video kayıtlarına 1 yıl süreyle erişim

Formu doldurun
Sizi arayalım!

1. Dönem Data Engineering Project Bootcamp Timeline

Bootcamp İçeriği

Tüm eğitimlerimiz, konunun tüm yönlerini ele alarak kapsamlı bir şekilde hazırlanmıştır.

  • Bir proje yap, hayatın değişsin!

  • Veri mühendisliğinde seviye atlamak ve vites yükseltmek seni heyecanlandırıyorsa,

  • Kod ve sorgu yazmak için parmakların gıdıklanıyorsa,

  • İş hayatına proje deneyimiyle daha da yaklaşmak istiyorsan,

  • Portföyünü harika projelerle donatmak ve CV’ni güçlendirmek istiyorsan,

  • İş görüşmeleri ve mülakatlarda anlatacak bir şeylerin olsun istiyorsan,

Mevcut işinde daha başarılı olmak istiyorsan,

Veri Mühendisliği Proje Eğitimi tam sana göre!

————————————————————————————————————————————————————————————————————————————————————————————————————-
Veri Mühendisliği Proje Eğitiminde 6 hafta boyunca katılımcılarla birlikte canlı olarak sıfırdan başlayıp son aşamaya kada uçtan uca bir proje gerçekleştirilir.
Bu proje eğitimi, sektörde uzun yıllar tecrübesi olan birçok veri mühendisinin görüş ve önerileri alınarak titizlikle tasarlandı ve hazırlandı. İş hayatında ve eğitimlerde genellikle daha önce başkaları tarafından kurulmuş bir altyapı ve platform üzerinde geliştirme yapılır. Ancak bu eğitim, altyapı, platform ve DataOps kurulum süreçlerini de deneyimlemeni sağlar.
  • Eğitimin süresi 6 hafta:
  • Cumartesi günleri 10-13 arasında, üçer saat
  • Ön hazırlık yok.

Ön gereksinimler:

  • VBO Data Engineering Bootcamp eğitimi katılımcıları
  • Projeyi yapmak için kendini yeterli seviyede hissedenler

Sıfır teori, %100 proje geliştirme!

  • DE Bootcamp’in ileri seviye versiyonu
  • Tüm proje Kubernetes üzerinde geliştirilir.
  • Her hafta projenin ilerleyen kısmı GitHub üzerinden paylaşılır.
  • Öğrenciler GitHub’a developer olarak eklenir.
  • Ödevler, projenin bir parçası olur.

NYC Sarı Taksi Veri Analizi ve Görselleştirme Projesi

Bu proje, New York City’nin sarı taksi verilerini analiz ederek şehirdeki ulaşım dinamiklerini anlamaya yönelik stratejik içgörüler sunmayı amaçlar. TLC’nin sağladığı PARQUET formatındaki veriler, veri mühendisliğinin temel süreçleriyle işlenir ve kullanıcı dostu görselleştirmelerle anlamlı çıktılara dönüştürülür.

Proje Kapsamı

  • Altyapı ve platform kurma:
  • Yoğunluk Analizi: Sarı taksilerin en sık kullanılan bölgeleri ve yoğun saatleri belirlenir.
  • Havalimanı Transfer Analizi: Havalimanı yolculukları, ücret, yolcu sayısı ve diğer metrikler açısından incelenir.
  • Zaman Bazlı Trendler: Sarı taksi verilerinde günlük, haftalık ve aylık trendler analiz edilir.
  • Kilit Performans Göstergeleri (KPI): Ortalama yolculuk süresi, mesafesi ve ücreti gibi metriklerin analizi yapılır.

Proje Aşamaları

  1. Proje Tanımı ve Gereksinim Analizi
    • İş Gereksinimleri
    • Veri kaynakları
    • Veri kullanıcıları
  2. Proje altyapısını hazırlama
    • Minikube ve kubectl kurulumu
    • Data Platform bileşenlerinin kurulumu
      • Object storage
      • CI/CD altyapısı
      • Apache Spark
      • Superset
      • Catalog
      • Airflow
      • Trino
  3. Veri modelleme (Data modeling)
  4. Veri Kaynağından Alınması:
    • NYC TLC tarafından sağlanan sarı taksi verileri günlük olarak indirilir ve projede kullanılır.
    • Veriler; tarih, saat, lokasyon, ücret detayları, mesafe ve yolcu sayısı gibi bilgileri içerir.
  5. Veri Temizleme ve Zenginleştirme:
    • Eksik, hatalı veya tutarsız veri kayıtları temizlenir.
    • Tarih ve saat bilgilerinden “gün,” “saat,” “ay” gibi yeni sütunlar oluşturulur.
    • Pick-up/drop-off noktaları NYC bölge haritasıyla eşleştirilerek zenginleştirilir.
  6. Veri Yükleme:
    • Temizlenmiş ve zenginleştirilmiş veriler analitik ortama aktarılır (Örn. Lakehouse).
    • Veriler Bronze, Silver ve Gold katmanlarına ayrılarak organize edilir.
  7. Görselleştirme ve Raporlama:
    • Superset ve Trino ile yoğunluk haritaları, zaman serisi analizleri ve havalimanı transferleri için özel dashboard’lar hazırlanır.
    • Kullanıcıların kolayca yorumlayabileceği, etkileşimli görselleştirmeler (dashboard) oluşturulur.

Proje Çıktıları

Bu proje NYC sarı taksi verilerinin analitik ortamda modellenerek analiz ve raporlamaya hazır hale getirilmesini sağlar.Modern veri mühendisliği araçları (Python, Apache Spark, Airflow, Trino) ve gerçek dünya verileri kullanarak uygulamalı gerçek bir proje deneyimi sunar.

Önemli Notlar:

Şu kriterleri sağlayan katılımcılar için sertifika düzenlenecektir:

1. Derslerin en az %70’ine katılmak.

2. Bitirme projesinden 100 üzerinden en az 70 puan almak.

Öğrenciler ile paylaşılacak kaynaklar: Eğitim video kayıtları, sanal makine, sunumlar ve derste kullanılan örnek kodlar VBO Platformu üzerinden paylaşılacaktır.

Eğitmen

Eğitmenlerimiz yılların vermiş olduğu tecrübeyle sizlere bilgi aktarımı sağlamaktadır.

Erkan Şirin

Senior Data/ML Engineer, AWS Solution Architect

Verdiği Eğitimler

Mentörler

No data was found

Data Engineering Bootcamp mezunu veya bu konularda kendini yeterli hissedenler. Bir bakıma Advanced versiyonu olacak. Sıfır teori tamamen proje yapılacak. Her hafta projenin ilerleyen kısmı öğrencilere github ile paylaşılacak. Öğrenciler de github’a developer olacaklar. Ödevleri projenin bir parçası olacak ve PR gönderecekler.

Mezun Yorumları

Mezunlarımız almış oldukları eğitimden sonra kendi deneyimlerini ve düşüncelerinizi sizlerle paylaşmaktadır.

No data was found

Referanslar