1 |
Dersin Adı: |
BÜYÜK VERİ |
2 |
Dersin Kodu: |
IYS4213 |
3 |
Dersin Türü: |
Seçmeli |
4 |
Dersin Seviyesi: |
Lisans |
5 |
Dersin Verildiği Yıl: |
4 |
6 |
Dersin Verildiği Yarıyıl: |
7 |
7 |
Dersin AKTS Kredisi: |
6 |
8 |
Teorik Ders Saati (saat/hafta): |
3 |
9 |
Uygulama Ders Saati (saat/hafta): |
0 |
10 |
Laboratuar Ders Saati (saat/hafta): |
0 |
11 |
Dersin Önkoşulu |
|
12 |
Ders İçin Önerilen Diğer Hususlar |
Yok |
13 |
Dersin Dili: |
Türkçe |
14 |
Dersin Veriliş Şekli |
Yüz yüze |
15 |
Dersin Koordinatörü: |
Doç. Dr. MELİH ENGİN |
16 |
Dersi Veren Diğer Öğretim Elemanları: |
Doç.Dr. Melih ENGİN |
17 |
Ders Koordinatörünün İletişim Bilgileri: |
Doç.Dr. Melih ENGİN 0224 294 26 95 melihengin@uludag.edu.tr |
18 |
Dersin Web Adresi: |
|
19 |
Dersin Amacı |
Bu ders Büyük Verideki mevcut teknolojileri, araçları, mimarileri ve sistemlerin kullanımını kapsıyarak analitik veri üretimi, depolama, yönetim, transfer, gelen büyük verilerde derinlemesine analizi kapsar. bir kapsama alanı sağlar yüksek performanslı ağlarda veri işlem çözümleri. Çeşitli alanlarda ortaya çıkan bigdata uygulamalarını inceleyerek, uygulama, geliştirme konularınıda kapsayarak yaygın olarak kullnaılan büyük veri uygulamalrını test eder. Ayrıca büyük veriyi analiz etmek için veri madenciliği ve makine öğrenme algoritmaları üzerinde durulacak. |
20 |
Dersin Mesleki Gelişime Katkısı: |
Bir işletme için gerekli olan sistemleri tasarlama ve iders bağlamındaki ihtiyaçlarına çözüm üretebilme. |
21 |
Ders Öğrenme Kazanımları |
1 |
"Teori" ve "uygulama" dengeli bir şekilde götürülerek öğrencinin büyük veri analizini ve yönetimini anlaması, kullnması ve pratik analizini öğretmeye yöneliktir. Ders öğrencinin büyük on-line depo sistemlerinde yer alan konuların ve sorunların anlmasını sağlamak için tasarlanmıştır, böyle bir sisteminin ihtiyaçlarını karşılamak için günümüz pratik teknikleri, bilgi ve yarının araştırma yaklaşımlarının çözümleri için bir temel oluşturmayı planlamaktadır.;
|
2 |
Büyük veri kavramlarını, terminolojiyi, veri analitiği özelliklerini, 5V-yapısal-yapısal olmayan-metadata gibi büyük veri tiplerini öğreneceklerdir.;
|
3 |
Nitel - nicel veri madenciliği, istatistiksel analiz, A/B testi, korelasyon, regresyon analizi gibi analiz tekniklerini kavrarlar.;
|
4 |
Kümeleme, dağıtık dosya sistemleri, ilişkisel veritabanı sistemleri, NoSQL, hafıza içi depolama gibi depolama kavramlarına ve paralel, dağıtık, toplu veri işleme gibi büyük veri işleme kavramlarına hakim olurlar.;
|
5 |
Büyük veri işlenmesinde Cloudera sanal makina, HDFS (Hadoop Dağıtık Dosya Sistemi), YARN (Yet Another Resource Negotiator and Hue) gibi paralel işleme ve diğer dizayn kalıplarını kavrarlar.;
|
|
Hafta |
Teori |
Uygulama |
1 |
Büyük Veriye Giriş: Kavramlar, terminoloji, özellikleri ve 5V, yapılandırılmış, yapılandırılmamış, yarı yapılandırılmış ve metadata gibi büyük Veri türlerini kapsar. İş ve araştırma motivasyonlarını kapsar. |
|
2 |
Büyük Veride Depolama ve Analiz: Kümeler gibi depolama kavramları kapsar, dağıtık dosya sistemleri, RDBMS, NoSQL, sharding, bellek depolama, aynı zamanda paralel, dağıtık, toplu veri işleme ve Hadoop gibi büyük veri işleme konseptlerini kapsar. |
|
3 |
Büyük Veri Analizi Teknikleri: Nicel, nitel veri madenciliği, istatistiksel analiz, Machine Learning, anlamsal analiz ve görsel veri analizi gibi analiz teknikleri ve konularını kapsar. |
|
4 |
MapReduce Çerçevesi ve Hadoop: Paralel süreçler ve büyük veri işleme için diğer tasarım desenleri kapsar. Cloudera sanal makine. HDFS, YARN ve Hue. |
|
5 |
Java ile mapreduce API ve Basic Programlama: Hadoop MapReduce Java API'yi inceleyeceğiz. |
|
6 |
Hive kullanımı: "veri ambarı" HDFS'ler ve Hadoop. Depolanan veriler üzerinde SQL sorguları. |
|
7 |
Spark Kullanımı: MapReduce çerçevesinin bellek tabanlı veri analizi ve RDD-Spark. |
|
8 |
Flume ve Kafka eğitimi. |
|
9 |
Spark veri akışı, Kafka ve Cassandra: Hızlı verilerin işlenmesi için standart haline gelmiş yığın kullanımı. |
|
10 |
Spark ile MLLib, Machine Learning: Veriler üzerinde öngörüde bulunmak için öğrenme algoritmalarını gözden geçireceğiz. |
|
11 |
Büyük Veri Kümelerinde görselleştirme: Büyük verinin içeriğini ve özelliklerini grafiksel olarak incelenmesini göreceğiz. |
|
12 |
Büyük veride ileri konular ve uygulamlar. |
|
13 |
Büyük veride ileri konular ve uygulamalar. |
|
14 |
Tekrar haftası. |
|
23 |
Ders Kitabı, Referanslar ve/veya Diğer Kaynaklar: |
1. Big Data Fundamentals: Concepts, Drivers & Techniques (1st ed.). Thomas Erl, Wajid Khattak, and Paul Buhler. Prentice Hall Press, Upper Saddle River, NJ, USA. 2016. 2. Big Data, Principles and Best Practices of Scalable Realtime Data Systems, Nathan Marz and James Warren, Manning Publications 2015. 3. Hadoop: The Definitive Guide, Tom White, O’Reilly, 2015. |
24 |
Değerlendirme |
|