Vielen Dank für die Zusendung Ihrer Anfrage! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Vielen Dank, dass Sie Ihre Buchung abgeschickt haben! Eines unserer Teammitglieder wird Sie in Kürze kontaktieren.
Schulungsübersicht
Big Data Überblick:
- Was ist Big Data
- Warum Big Data an Popularität gewinnt
- Big Data Fallstudien
- Big Data Merkmale
- Lösungen für die Arbeit an Big Data.
Hadoop und seine Komponenten:
- Was ist Hadoop und was sind seine Komponenten.
- Hadoop Architektur und die Eigenschaften der Daten, die es verarbeiten kann.
- Kurzer Überblick über die Geschichte von Hadoop, Unternehmen, die es verwenden und warum sie damit begonnen haben, es zu verwenden.
- Hadoop Rahmenwerk und seine Komponenten - im Detail erklärt.
- Was ist HDFS und Lese- und Schreibvorgänge in Hadoop Distributed File System.
- Wie man einen Hadoop Cluster in verschiedenen Modi einrichtet - Stand-Alone/Pseudo/Multi Node Cluster.
(Dies beinhaltet das Einrichten eines Hadoop Clusters in VirtualBox/KVM/VMware, Netzwerkkonfigurationen, die sorgfältig geprüft werden müssen, das Ausführen von Hadoop Daemons und das Testen des Clusters).
- Was ist Map Reduce Frame Work und wie funktioniert es.
- Ausführen von Map-Reduce-Aufträgen auf einem Hadoop-Cluster.
- Verstehen von Replikation, Spiegelung und Rack Awareness im Kontext von Hadoop Clustern.
Hadoop Cluster-Planung:
- Wie Sie Ihren Hadoop-Cluster planen.
- Verstehen von Hardware und Software zur Planung eines Hadoop-Clusters.
- Verstehen von Workloads und Planung von Clustern, um Ausfälle zu vermeiden und optimale Leistung zu erzielen.
Was ist MapR und warum MapR :
- Überblick über MapR und seine Architektur.
- Verstehen und Funktionieren von MapR Control System, MapR Volumes, Snapshots und Mirrors.
- Planung eines Clusters im Kontext von MapR.
- Vergleich von MapR mit anderen Distributionen und Apache Hadoop.
- MapR-Installation und Cluster-Bereitstellung.
Cluster Einrichtung & Verwaltung:
- Verwaltung von Diensten, Knoten, Snapshots, Mirror Volumes und Remote Clustern.
- Verstehen und Verwalten von Nodes.
- Verstehen von Hadoop-Komponenten, Installieren von Hadoop-Komponenten neben MapR-Diensten.
- Accessing Data on cluster including via NFS Verwalten von Services & Nodes.
- Verwalten von Daten mit Hilfe von Volumes, Verwalten von Benutzern und Gruppen, Verwalten und Zuweisen von Rollen zu Nodes, Inbetriebnahme und Außerbetriebnahme von Nodes, Cluster-Administration und Leistungsüberwachung, Konfigurieren/Analysieren und Überwachen von Metriken zur Leistungsüberwachung, Konfigurieren und Verwalten von MapR-Sicherheit.
- Verstehen und Arbeiten mit M7- Native Storage für MapR Tabellen.
- Cluster-Konfiguration und -Tuning für optimale Leistung.
Cluster-Upgrade und Integration mit anderen Setups:
- Upgrade der Softwareversion von MapR und Arten von Upgrades.
- Konfigurieren des MapR-Clusters für den Zugriff auf den HDFS-Cluster.
- Einrichten von MapR-Clustern auf Amazon Elastic Mapreduce.
Alle oben genannten Themen beinhalten Demonstrationen und Übungseinheiten, damit die Teilnehmer praktische Erfahrungen mit der Technologie sammeln können.
Voraussetzungen
- Grundkenntnisse in Linux FS
- Grundlegende Java
- Kenntnisse von Apache Hadoop (empfohlen)
28 Stunden
Erfahrungsberichte (1)
praktische Dinge der Umsetzung, auch die Theorie wurde gut von Ajay vermittelt
Dominik Mazur - Capgemini Polska Sp. z o.o.
Kurs - Hadoop Administration on MapR
Maschinelle Übersetzung