Big Data Processing (E)
Niveau
Masterstudium
Lernergebnisse der Lehrveranstaltungen/des Moduls
Folgende Kompetenzen werden in der Lehrveranstaltung erarbeitet:
- Die Studierenden kenne die besonderen Herausforderungen die bei der Speicherung und Verarbeitung großer Datenmengen (V-Modell: Volume, Variety, Velocity, Veracity) auftreten.
- Die Studierenden kennen Möglichkeiten diesen Herausforderungen zu begegnen (hierzu werden beispielhaft Systeme aus den jeweiligen Bereichen des V-Modells besprochen).
- Die Studierenden können entsprechende Lösungen selbst mit Blick auf eine konkrete Problemstellung entwickeln und zur Anwendung bringen.
- Die Studierenden kenne die besonderen Herausforderungen die bei der Speicherung und Verarbeitung großer Datenmengen (V-Modell: Volume, Variety, Velocity, Veracity) auftreten.
- Die Studierenden kennen Möglichkeiten diesen Herausforderungen zu begegnen (hierzu werden beispielhaft Systeme aus den jeweiligen Bereichen des V-Modells besprochen).
- Die Studierenden können entsprechende Lösungen selbst mit Blick auf eine konkrete Problemstellung entwickeln und zur Anwendung bringen.
Voraussetzungen der Lehrveranstaltung
Keine Voraussetzungen
Lehrinhalte
Den Studierenden werden in die grundlegenden Eigenschaften von Big Data eingeführt. Dabei wird besonderes Augenmerk auf den Umgang mit diesen Daten gelegt und das erworbene Wissen mit Beispielen gefestigt. Für die Lösung von Big Data Problemen, werden geeignete Frameworks vorgestellt und im Rahmen von interaktiven Workshops mit Fallstudien bearbeitet. Als Beispiele hierfür sind zu nennen:
- Apache Hadoop
- Apache Spark
- Apache Flink
- Apache Storm
- Apache Samza
- Apache Kafka
Diese Frameworks sollen anhand von Fallbeispielen erklärt und eingesetzt werden. Dafür kann auf die zentral bereitgestellten Data Labs zugegriffen werden.
- Apache Hadoop
- Apache Spark
- Apache Flink
- Apache Storm
- Apache Samza
- Apache Kafka
Diese Frameworks sollen anhand von Fallbeispielen erklärt und eingesetzt werden. Dafür kann auf die zentral bereitgestellten Data Labs zugegriffen werden.
Empfohlene Fachliteratur
PRIMÄRLITERATUR:
- Jain, V. K. (2017): Big Data and Hadoop (Ed. 1), Khanna Book Publishing, New Delhi (ISBN: 978-9382609131)
- Karau, H.; Warren, R. (2017): High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark (Ed. 1), O'Reilly Media, Farnham (ISBN: 978-1491943205)
SEKUNDÄRLITERATUR:
- O'Neil, C.; Schutt, R. (2013): Doing Data Science. Straight Talk from the Frontline (Ed. 1), O'Reilly Media, Sebastopol (ISBN: 978-1449358655)
- Narkhede, N.; Shapira, G.; Palino, T. (2017): Kafka: The Definitive Guide: Real-Time Data and Stream Processing at Scale (Ed. 1), O'Reilly Media, Farnham (ISBN: 978-1491936160)
- Jain, V. K. (2017): Big Data and Hadoop (Ed. 1), Khanna Book Publishing, New Delhi (ISBN: 978-9382609131)
- Karau, H.; Warren, R. (2017): High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark (Ed. 1), O'Reilly Media, Farnham (ISBN: 978-1491943205)
SEKUNDÄRLITERATUR:
- O'Neil, C.; Schutt, R. (2013): Doing Data Science. Straight Talk from the Frontline (Ed. 1), O'Reilly Media, Sebastopol (ISBN: 978-1449358655)
- Narkhede, N.; Shapira, G.; Palino, T. (2017): Kafka: The Definitive Guide: Real-Time Data and Stream Processing at Scale (Ed. 1), O'Reilly Media, Farnham (ISBN: 978-1491936160)
Bewertungsmethoden und -Kriterien
Klausur
Unterrichtssprache
Englisch
Anzahl der zugewiesenen ECTS-Credits
4
E-Learning Anteil in %
25
Semesterwochenstunden (SWS)
2.0
Geplante Lehr- und Lernmethode
Folgende Methoden kommen zum Einsatz:
- Vortrag mit Diskussion
- Gruppenarbeiten
- Interaktiver Workshop
- Vortrag mit Diskussion
- Gruppenarbeiten
- Interaktiver Workshop
Semester/Trisemester, In dem die Lehrveranstaltung/Das Modul Angeboten wird
1
Name des/der Vortragenden
Tuta Mario
Studienjahr
Kennzahl der Lehrveranstaltung/des Moduls
DPR.1
Art der Lehrveranstaltung/des Moduls
Integrierte Lehrveranstaltung
Art der Lehrveranstaltung
Pflichtfach
Praktikum/Praktika
kein