Big Data Eğitimi

Big Data eğitimi, katılımcıların büyük veri ekosistemini uçtan uca kavrayarak, modern veri mimarilerini kurgulama ve yönetme becerisi kazanmalarını amaçlar. 4 gün sürecek yoğun program boyunca; Hadoop’un temelinden Spark’ın hızına, Kafka’nın gerçek zamanlı akışından NoSQL dünyasının esnekliğine kadar tüm kritik araçlar, gerçek dünya senaryoları ve pratik uygulamalarla ele alınır. Şirketlerin veri odaklı karar alma süreçlerini iyileştirmek ve rekabet avantajı sağlamak isteyen profesyoneller için tasarlanmıştır.

Bireysel başvuru için burayı tıklayınız. Kurumsal eğitim için daha fazla bilgi ve eğitim talepleri için; satis@veribilimiokulu.com e-posta adresinden veya +90 212 231 30 01 numaralı telefondan bize ulaşabilirsiniz.

  • Temel linux komutlarına hakimiyet

  • İnternet bağlantısı

1. GÜN: Büyük Veri Temelleri ve Depolama Mimarisi
  • Bölüm 1: Giriş ve Ekosistem

    • Büyük Veri (Big Data) nedir? 5V Kriteri ve Sektörel Kullanım Alanları.

    • Büyük Veri Ortamının Kurulması (Docker ve Cluster Mimarileri).

    • Hadoop Genel Tanıtımı ve Tarihsel Gelişimi.

  • Bölüm 2: Veri Depolama ve Kaynak Yönetimi

    • HDFS (Hadoop Distributed File System): Blok yapısı, replikasyon ve hata toleransı.

    • Apache YARN: Kaynak yönetimi ve iş zamanlama (Scheduling).

    • Bulut Depolama (S3/Azure Blob) ve HDFS Karşılaştırması.

2. GÜN: Büyük Veri Sorgulama ve Batch (Yığın) İşleme
  • Bölüm 3: SQL on Big Data (Sorgulama Katmanı)

    • Apache Hive: Veri ambarı mimarisi ve SQL tabanlı sorgulama.

    • Apache Trino (Presto): Dağıtık ve yüksek hızlı SQL motoru.

  • Bölüm 4: Modern Veri İşleme – Apache Spark

    • Spark Mimarisi ve Bellek İçi (In-Memory) İşleme Avantajı.

    • Spark Dataframe ve SQL: Yapılandırılmış veri ile modern çalışma teknikleri.

    • Spark RDD Temelleri ve Optimizasyon Stratejileri (Shuffling, Partitioning).

3. GÜN: Veri Aktarımı ve Gerçek Zamanlı (Streaming) Sistemler
  • Bölüm 5: Veri Entegrasyonu ve Aktarımı

    • İlişkisel Veritabanlarından Veri Aktarımı (ETL Süreçleri).

    • Batch Veri Aktarım Stratejileri ve Araç Tanıtımları (Spark Ingestion).

  • Bölüm 6: Gerçek Zamanlı Veri İşleme

    • Apache Kafka: Dağıtık mesajlaşma kuyrukları, Topic ve Producer/Consumer mantığı.

    • Spark Streaming: Akan verinin (Real-time data) mikro-batch yöntemiyle işlenmesi.

    • Gerçek Zamanlı Analitik Senaryoları (Fraud Detection, Log Analysis).

4. GÜN: NoSQL Veritabanları ve Uçtan Uca Uygulama
  • Bölüm 7: NoSQL Dünyası ve Veri Modelleme

    • NoSQL Giriş: Neden ihtiyaç duyuyoruz? Relational vs. NoSQL.

    • CAP Teoremi: Tutarlılık (Consistency), Erişilebilirlik (Availability) ve Bölünme Toleransı (Partition Tolerance) dengesi.

    • Popüler NoSQL Çözümleri:

      • MongoDB: Doküman tabanlı modelleme.

      • Elasticsearch: Metin tabanlı arama ve analitik motoru.

      • Cassandra: Geniş sütunlu (Wide-column) ve yüksek ölçeklenebilir mimari.

  • Bölüm 8: Final ve Proje Senaryosu

    • Büyük Veri Proje Yönetimi: Planlama ve Mimari Kararlar.

    • Uçtan Uca Case Study: Verinin Kafka’dan Spark’a, oradan NoSQL/HDFS’e yolculuğu.

Eğitimlerle ilgili bilgi almak ve diğer tüm sorularınız için bize ulaşın!

Adınız Soyadınız
Email adresiniz
Telefon Numaranız
Firma İsmi
Mesajınız

Hızlı başvuru yapın !

İlgilendiğiniz Program
Ad Soyad
Eposta Adresiniz
Telefon Numaranız
Gizliliğe genel bakış

Bu web sitesi, size mümkün olan en iyi kullanıcı deneyimini sunabilmek için çerezleri kullanır. Çerez bilgileri tarayıcınızda saklanır ve web sitemize döndüğünüzde sizi tanımak ve ekibimizin web sitesinin hangi bölümlerini en ilginç ve yararlı bulduğunuzu anlamasına yardımcı olmak gibi işlevleri yerine getirir.

Çerez politikasını görüntülemek için tıklayın.