Big Data Eğitimi
Big Data eğitimi, katılımcıların büyük veri ekosistemini uçtan uca kavrayarak, modern veri mimarilerini kurgulama ve yönetme becerisi kazanmalarını amaçlar. 4 gün sürecek yoğun program boyunca; Hadoop’un temelinden Spark’ın hızına, Kafka’nın gerçek zamanlı akışından NoSQL dünyasının esnekliğine kadar tüm kritik araçlar, gerçek dünya senaryoları ve pratik uygulamalarla ele alınır. Şirketlerin veri odaklı karar alma süreçlerini iyileştirmek ve rekabet avantajı sağlamak isteyen profesyoneller için tasarlanmıştır.
Bireysel başvuru için burayı tıklayınız. Kurumsal eğitim için daha fazla bilgi ve eğitim talepleri için; satis@veribilimiokulu.com e-posta adresinden veya +90 212 231 30 01 numaralı telefondan bize ulaşabilirsiniz.
- Eğitim Süresi: 4 gün
- Eğitim Şekli: Online Canlı
Temel linux komutlarına hakimiyet
İnternet bağlantısı
1. GÜN: Büyük Veri Temelleri ve Depolama Mimarisi
Bölüm 1: Giriş ve Ekosistem
Büyük Veri (Big Data) nedir? 5V Kriteri ve Sektörel Kullanım Alanları.
Büyük Veri Ortamının Kurulması (Docker ve Cluster Mimarileri).
Hadoop Genel Tanıtımı ve Tarihsel Gelişimi.
Bölüm 2: Veri Depolama ve Kaynak Yönetimi
HDFS (Hadoop Distributed File System): Blok yapısı, replikasyon ve hata toleransı.
Apache YARN: Kaynak yönetimi ve iş zamanlama (Scheduling).
Bulut Depolama (S3/Azure Blob) ve HDFS Karşılaştırması.
2. GÜN: Büyük Veri Sorgulama ve Batch (Yığın) İşleme
Bölüm 3: SQL on Big Data (Sorgulama Katmanı)
Apache Hive: Veri ambarı mimarisi ve SQL tabanlı sorgulama.
Apache Trino (Presto): Dağıtık ve yüksek hızlı SQL motoru.
Bölüm 4: Modern Veri İşleme – Apache Spark
Spark Mimarisi ve Bellek İçi (In-Memory) İşleme Avantajı.
Spark Dataframe ve SQL: Yapılandırılmış veri ile modern çalışma teknikleri.
Spark RDD Temelleri ve Optimizasyon Stratejileri (Shuffling, Partitioning).
3. GÜN: Veri Aktarımı ve Gerçek Zamanlı (Streaming) Sistemler
Bölüm 5: Veri Entegrasyonu ve Aktarımı
İlişkisel Veritabanlarından Veri Aktarımı (ETL Süreçleri).
Batch Veri Aktarım Stratejileri ve Araç Tanıtımları (Spark Ingestion).
Bölüm 6: Gerçek Zamanlı Veri İşleme
Apache Kafka: Dağıtık mesajlaşma kuyrukları, Topic ve Producer/Consumer mantığı.
Spark Streaming: Akan verinin (Real-time data) mikro-batch yöntemiyle işlenmesi.
Gerçek Zamanlı Analitik Senaryoları (Fraud Detection, Log Analysis).
4. GÜN: NoSQL Veritabanları ve Uçtan Uca Uygulama
Bölüm 7: NoSQL Dünyası ve Veri Modelleme
NoSQL Giriş: Neden ihtiyaç duyuyoruz? Relational vs. NoSQL.
CAP Teoremi: Tutarlılık (Consistency), Erişilebilirlik (Availability) ve Bölünme Toleransı (Partition Tolerance) dengesi.
Popüler NoSQL Çözümleri:
MongoDB: Doküman tabanlı modelleme.
Elasticsearch: Metin tabanlı arama ve analitik motoru.
Cassandra: Geniş sütunlu (Wide-column) ve yüksek ölçeklenebilir mimari.
Bölüm 8: Final ve Proje Senaryosu
Büyük Veri Proje Yönetimi: Planlama ve Mimari Kararlar.
Uçtan Uca Case Study: Verinin Kafka’dan Spark’a, oradan NoSQL/HDFS’e yolculuğu.
Eğitimlerle ilgili bilgi almak ve diğer tüm sorularınız için bize ulaşın!