Açıklama
Başvuru Durumu
Data Engineering, bir işletmenin/kurumun verisinin istenilen yer, zaman, format, doğruluk ve tutarlılıkta hazır edilmesini sağlayan sitemin tasarım, inşa ve idamesini sağlayan bir disiplindir.
Bu veriye iç müşteriler diyebileceğimiz işletme çalışanlarının ihtiyacı olabileceği gibi, işletme dışı müşterilerin (dış müşteriler) de ihtiyacı olabilir.
Yukarıda belirtilen özellikteki verinin hazırlanmasını sağlayan rol ise data engineer rolüdür. Son yıllarda verinin baş döndürücü artışıyla beraber veriye dayalı yeni ürün geliştirme, ürün ve hizmet farklılaştırması gibi bir çok fırsatlar doğmuş, veriye dayalı devasa ekonomiler oluşmuştur. Ancak bu fırsatları yakalamak için de veriden değer elde etmek zorunludur. İşte bu katma değerde en meşakkatli işlerden birini data engineer yapar.
Eğitim Özeti
Data Engineer son yılların gözde ve en çok talep edilen rollerinden birisidir. Çünkü veri, artık büyük veya küçük, sektör farkı gözetmeksizin tüm kurum ve şirketlerde bulunmaktadır. Sizler de bir şeyler inşa etmek, ortaya koymak, tasarlayıp kurduğunuz veri akış hatlarından (pipelines) çıkan verinin iç veya dış müşteriler tarafından tüketildiğini görmek ve bunun keyfini yudumlamak istiyorsanız çok doğru bir adrestesiniz.
- VBO Bootcamp eski katılımcılarına yüzde 20 indirim imkanı
- Gerçekçi Proje ve Ödevler ( PySpark, Data Pipelines, ETL, Streaming)
Eğitim 3 safhadan oluşmaktadır;
1. Ön Hazırlık: Kesin kayıtla başlar, 2-4 hafta
Bu aşamada canlı derslerin anlaşılmasını kolaylaştıracak eğitimler Miuul platformu üzerinden mentör ve eğitmen desteği ve rehberliğinde alınır. Örneğin canlı derste docker-compose veya SQL join kullanılacak ise ayrıca bunların ne demek olduğu için zaman kaybetmemek amaçlanmıştır.
2. Canlı Dersler: 7 hafta.
Eğitimin ana bölümüdür ve aşağıda “Program süresince bahsedilecek konular” başlığındaki müfredat ile haftada 6 saat ders, 1-2 saat etüd/ödev kontrolü olacak şekilde online platformlar (Zoom) üzerinden devam eder.
3. Bitirme Projesi: yaklaşık 2 hafta.
Canlı dersler bittikten sonra kursiyerlerin bitirme projelerini tamamladıkları ve online platformlar (Zoom) üzerinden sundukları safhadır. Bu safhada bireysel/grup çalışması yapılır. Mentör ve eğitmen desteği devam eder.
Sıkça Sorulan Sorular
Neden bu program?
- Bootcamp, online/uzaktan olarak deneyimli bir eğitmen ve ekip tarafından verilmektedir.
- Bootcamp esnasında iş hayatında rahatlıkla kullanabileceğiniz seviyede profesyonel data engineering öğreneceksiniz.
- Türkçe olarak hiçbir online ya da sınıf eğitimlerinde bulunmayan ve sadece bootcamp katılımcılarına özgü içeriklerle gerçek hayata uygun bir süreç deneyimleyeceksiniz.
- Birlikte öğrenme ve topluluk gücünden faydalanma imkanı bulacaksınız.
- Bu program daha önceki Advanced Big Data and Datascience at Scale Bootcamp programından datascience konularının çıkarılmış ve data engineering konularının güçlendirilmiş versiyonudur.
Ön Gereksinimler
- Python bilgisi (ön hazırlıkta mevcuttur)
- Temel Docker bilgisi (ön hazırlıkta mevcuttur)
- Temel makine öğrenmesi bilgisi (ön hazırlıkta mevcuttur)
- Daha önce iş için veya kişisel eğitim amacıyla ML modeli geliştirmiş olmak
- Temel SQL ve veri tabanı bilgisine sahip olmak (ön hazırlıkta mevcuttur)
Eğitim süresi
Eğitim süresi:
- Ön hazırlık aşaması Miuul üzerinden 2 hafta
- Canlı eğitimler 7 hafta
- Bitirme projesi 1,5 hafta
Ön hazırlık aşaması kesin kayıt gerçekleşir gerçekleşmez başlar.
Canlı eğitimler Cumartesi-Pazar 10:00-13:00 saatlerinde olacaktır.
Ayrıca hafta içi Perşembe saat 20:00’de verilen ödevlerin sunumları/çözümleri olacaktır. (1-2 saat arası)
Programın işleyişi
- Aktif öğrenme süreci: Alıştırmalar-ödevler ve projeler
- Kendi programını kendin belirle: Tüm derslerin video versiyonları ile müsaitlik durumuna göre tekrar çalışma imkanı.
Program süresince bahsedilecek konular
- Linux Basic, Bash Script (Ön hazırlık)
- Git Basic (Ön hazırlık)
- Crontab (Ön hazırlık)
- Postgresql & SQL Basics (Ön hazırlık)
- Docker & Kubernetes (Ön hazırlık)
- Python Programming (Ön hazırlık)
- Apache Hadoop HDFS
- YARN, Hive
- Apache Sqoop
- Apache Kafka
- Apache Spark Dataframe API
- Spark Optimization Techniques
- Lakehouse: Delta Lake
- Apache Spark Streaming
- Spark on Databricks
- Introduction to NoSQL and CAP Theorem
- Elastic Stack (Elasticsearch, Logstash, Kibana, Beats)
- Apache Cassandra
- MongoDB
- Apache Airflow
- AWS Core Services
- Data Engineering on AWS
Demos:
- Multinode Kubernetes Cluster
Extras:
- Introduction to Apache Flink
Program süresince proje gerçekleştirilecek konular
- PySpark
- Data Pipeline
- ETL
- Streaming
Bu program kimlere uygun?
Öncelik sırasına göre Data Engineer, ML Engineer ve Data Scientist rollerinde bulunanlar ile bu rollere aday olanlara yöneliktir. Ekibinde bu rollere sahip ekip liderleri de takip edebilir.
Ayrıca sektörde yönünüzü bulmak, nereye doğru gitmek istediğinize daha sağlıklı karar vermek istiyorsanız bu eğitim sonrasında bu hususların netleşeceğini düşünüyoruz.
Peki ben bu programı takip edebilir miyim?
Temel Python programlama ve SQL biliyorsanız, temel bilgisayar bilimleri kavramlarına aşinaysanız bu eğitimi takip edebilirsiniz.
Program süresince dersler nerede işlenecektir?
Ön hazırlık aşaması Miuul üzerinden takip edilecektir.
Canlı eğitimler online olarak Microsoft Teams, Zoom vb. platformlar üzerinde gerçekleştirilecektir.
Çalışmalarımı nasıl bir bilgisayar üzerinde gerçekleştirebilirim?
Eğitim için en az 8 GB RAM, 4 çekirdek işlemci ve 60 GB boş disk alanına sahip bilgisayar ve fiber/adsl internet erişimi gereklidir. İşletim sistem MacOS (M1 işlemcili olanlar hariç) veya Windows 10/11 olabilir. Sanallaştırma yazılımı olarak Virtualbox veya VmWare Player/Pro tercih edilebilir.
Önemli Not:
Sertifika: Sadece başarılı katılımcılar için düzenlenecektir. Başarı kriterleri; ders takibi %70, ödevler %70 ve bitirme projesi %70’tir.
Öğrenciler ile paylaşılacak kaynaklar: Eğitim video kayıtları, sanal makine, sunumlar ve derste kullanılan örnek kodlar.
Bulut: Bulut kullanılan derslerde bulut maliyeti katılımcıya aittir. Çok yüksek bir bulut maliyeti beklenmemektedir.
Değerlendirmeler
Henüz değerlendirme yapılmadı.