HBase for Developers Schulung
In diesem Kurs wird HBase vorgestellt - ein No SQL Speicher über Hadoop . Der Kurs richtet sich an Entwickler, die HBase zum Entwickeln von Anwendungen verwenden, sowie an Administratoren, die HBase-Cluster verwalten.
Wir werden einen Entwickler durch die HBase-Architektur sowie die Datenmodellierung und Anwendungsentwicklung auf HBase führen. Außerdem werden die Verwendung von MapReduce mit HBase und einige Verwaltungsthemen im Zusammenhang mit der Leistungsoptimierung erläutert. Der Kurs ist sehr praktisch mit vielen Laborübungen.
Dauer : 3 Tage
Zielgruppe : Entwickler und Administratoren
Schulungsübersicht
- Abschnitt 1: Einführung in Big Data & NoSQL
- Big Data Ökosystem
- NoSQL Überblick
- CAP-Theorem
- Wann ist NoSQL geeignet
- Säulenspeicher
- HBase und NoSQL
- Abschnitt 2: Einführung in HBase
- Konzepte und Design
- Architektur (HMaster und Region Server)
- Datenintegrität
- HBase-Ökosystem
- Übung: HBase erforschen
- Abschnitt 3 : HBase Datenmodell
- Namespaces, Tabellen und Regionen
- Zeilen, Spalten, Spaltenfamilien, Versionen
- HBase-Shell und Admin-Befehle
- Übung: HBase-Shell
- Abschnitt 3 : Accessing HBase mit Java API
- Einführung in die Java API
- Lese-/Schreibpfad
- Zeitreihen-Daten
- Scans
- Verkleinern
- Filtern
- Zähler
- Co-Prozessoren
- Praktika (mehrere) : Verwendung von HBase Java API zur Implementierung von Zeitreihen, Map Reduce, Filtern und Zählern.
- Abschnitt 4 : HBase Schema Design : Gruppenarbeit
- den Studenten werden reale Anwendungsfälle vorgestellt
- Studenten arbeiten in Gruppen, um Designlösungen zu entwickeln
- Diskussion/Kritik und Lernen aus mehreren Entwürfen
- Übungen: Implementierung eines Szenarios in HBase
- Abschnitt 5: HBase Interna
- Verstehen von HBase unter der Haube
- Memfile / HFile / WAL
- HDFS-Speicher
- Verdichtungen
- Aufteilungen
- Bloom-Filter
- Zwischenspeicher
- Diagnostik
- Abschnitt 6: HBase-Installation und -Konfiguration
- Auswahl der Hardware
- Installationsmethoden
- Gemeinsame Konfigurationen
- Übung: Installation von HBase
- Abschnitt 7 : HBase-Ökosystem
- Entwicklung von Anwendungen mit HBase
- Interaktion mit anderen Hadoop Stacks (MapReduce, Pig, Hive)
- Rahmenwerke rund um HBase
- Fortgeschrittene Konzepte (Co-Prozessoren)
- Praktika: Schreiben von HBase-Anwendungen
- Abschnitt 8 : Überwachung und bewährte Praktiken
- Überwachungswerkzeuge und -praktiken
- Optimierung von HBase
- HBase in der Cloud
- Anwendungsfälle von HBase in der realen Welt
- Labs: Überprüfung der HBase-Vitaldaten
Voraussetzungen
- Kenntnisse in der Programmiersprache Java
- Kenntnisse der Programmiersprache Java (Navigieren Linux in der Kommandozeile, Bearbeiten von Dateien mit vi / nano)
- Eine Java IDE wie Eclipse oder IntelliJ
Lab-Umgebung:
Den Studierenden wird ein funktionierender HBase-Cluster zur Verfügung gestellt. Die Studierenden benötigen einen SSH-Client und einen Browser für den Zugriff auf den Cluster.
Null-Installation: Es ist nicht notwendig, die HBase-Software auf den Rechnern der Studenten zu installieren!
Offene Schulungskurse erfordern mindestens 5 Teilnehmer.
HBase for Developers Schulung - Booking
HBase for Developers Schulung - Enquiry
HBase for Developers - Beratungsanfrage
Beratungsanfrage
Erfahrungsberichte (5)
Interessante Präsentation und Übungen
Szymon - Agora SA
Kurs - Scylla Database
Maschinelle Übersetzung
Vorbereitung und Organisation des Trainers sowie die Qualität der bereitgestellten Materialien auf GitHub.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Kurs - Impala for Business Intelligence
Maschinelle Übersetzung
Es gibt mir Einblicke in Redis und führt mich auch auf den richtigen Weg, falls ich mehr über Redis erfahren möchte.
Ameer Fiqri Barahim - Sarawak Information Systems Sdn Bhd
Kurs - Redis for High Availability and Performance Training Course
Maschinelle Übersetzung
Die VM, die mir sehr gut gefallen hat Der Lehrer war sehr kenntnisreich sowohl zum Thema als auch zu anderen Themen, er war sehr nett und freundlich Mir hat die Einrichtung in Dubai sehr gut gefallen.
Safar Alqahtani - Elm Information Security
Kurs - Big Data Analytics in Health
Maschinelle Übersetzung
Liked very much the interactive way of learning.
Luigi Loiacono
Kurs - Data Analysis with Hive/HiveQL
Maschinelle Übersetzung
Kommende Kurse
Kombinierte Kurse
Administrator Training for Apache Hadoop
35 StundenZielgruppe:
Der Kurs richtet sich an IT-Spezialisten, die nach einer Lösung für die Speicherung und Verarbeitung großer Datenmengen in einer verteilten Systemumgebung suchen
Goal:
Vertiefte Kenntnisse über Hadoop Clusterverwaltung.
Big Data Analytics in Health
21 StundenBei der Big-Data-Analyse werden große Mengen unterschiedlicher Datensätze untersucht, um Korrelationen, verborgene Muster und andere nützliche Erkenntnisse aufzudecken.
Die Gesundheitsbranche verfügt über riesige Mengen komplexer heterogener medizinischer und klinischer Daten. Die Anwendung von Big-Data-Analysen auf Gesundheitsdaten bietet ein großes Potenzial für die Gewinnung von Erkenntnissen zur Verbesserung der Gesundheitsversorgung. Die enorme Anzahl dieser Datensätze ist jedoch eine große Herausforderung für Analysen und praktische Anwendungen in einem klinischen Umfeld.
In diesem von Lehrern geleiteten Live-Training (Remote) lernen die Teilnehmer, wie Big-Data-Analysen im Gesundheitsbereich durchgeführt werden, während sie eine Reihe von praktischen Live-Laborübungen absolvieren.
Am Ende dieser Schulung können die Teilnehmer:
- Installieren und konfigurieren Sie Big Data-Analysetools wie Hadoop MapReduce und Spark
- Verstehen Sie die Eigenschaften von medizinischen Daten
- Wenden Sie Big-Data-Techniken an, um mit medizinischen Daten umzugehen
- Studieren Sie Big-Data-Systeme und -Algorithmen im Kontext von Gesundheitsanwendungen
Publikum
- Entwickler
- Data Scientists
Format des Kurses
- Teilvorlesung, Teildiskussion, Übungen und viel praktisches Üben.
Hinweis
- Um ein individuelles Training für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um dies zu arrangieren.
Big Data Storage Solution - NoSQL
14 StundenWenn herkömmliche Speichertechnologien nicht die Datenmenge verarbeiten, die Sie zum Speichern benötigen, gibt es Hunderte von Alternativen. Dieser Kurs soll den Teilnehmern zeigen, welche Alternativen zum Speichern und Analysieren von Big Data und welche Vor- und Nachteile sie haben.
Dieser Kurs konzentriert sich hauptsächlich auf die Diskussion und Präsentation von Lösungen, wobei praktische Übungen auf Anfrage erhältlich sind.
Big Data & Database Systems Fundamentals
14 StundenDer Kurs ist Teil der Fähigkeiten von Data Scientist (Bereich: Daten und Technologie).
NoSQL Database with Microsoft Azure Cosmos DB
14 StundenDiese von einem Trainer geleitete Live-Schulung (online oder vor Ort) richtet sich an Datenbankadministratoren oder Entwickler, die Microsoft Azure Cosmos DB zur Entwicklung und Verwaltung von Anwendungen mit hoher Reaktionsfähigkeit und geringer Latenz nutzen möchten.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Bereitstellen der notwendigen Cosmos DB-Ressourcen, um mit dem Aufbau von Datenbanken und Anwendungen zu beginnen.
- Skalieren Sie die Anwendungsleistung und den Speicher durch Nutzung der APIs in Cosmos DB.
- Verwalten Sie den Datenbankbetrieb und reduzieren Sie die Kosten durch Optimierung der Cosmos DB-Ressourcen.
Hadoop Administration
21 StundenDer Kurs richtet sich an IT-Spezialisten, die nach einer Lösung für die Speicherung und Verarbeitung großer Datenmengen in einer verteilten Systemumgebung suchen.
Ziel des Kurses:
Erwerb von Kenntnissen über Hadoop Cluster-Verwaltung
Hadoop For Administrators
21 StundenApache Hadoop ist das beliebteste Framework für die Verarbeitung von Big Data auf Server-Clustern. In diesem dreitägigen (optional auch viertägigen) Kurs lernen die Teilnehmer die geschäftlichen Vorteile und Anwendungsfälle für Hadoop und sein Ökosystem kennen, wie man den Einsatz und das Wachstum von Clustern plant, wie man Hadoop installiert, wartet, überwacht, Fehler behebt und optimiert. Die Teilnehmer üben auch das Laden von Massendaten in Clustern, machen sich mit verschiedenen Hadoop-Distributionen vertraut und üben die Installation und Verwaltung von Hadoop-Ökosystem-Tools. Der Kurs endet mit einer Diskussion über die Sicherung von Clustern mit Kerberos.
"...Die Materialien waren sehr gut vorbereitet und wurden gründlich behandelt. Das Labor war sehr hilfreich und gut organisiert.
- Andrew Nguyen, leitender DW-Ingenieur für Integration, Microsoft Online Advertising
Zuhörerschaft
Hadoop Administratoren
Format
Vorlesungen und praktische Übungen, ungefähres Gleichgewicht 60% Vorlesungen, 40% Übungen.
Hadoop for Developers (4 days)
28 StundenApache Hadoop ist das beliebteste Framework für die Verarbeitung Big Data auf Server-Clustern. Dieser Kurs wird einen Entwickler in verschiedene Komponenten (HDFS, MapReduce, Pig, Hive und HBase) Hadoop Ökosystem einführen.
Advanced Hadoop for Developers
21 StundenApache Hadoop ist eines der beliebtesten Frameworks für die Verarbeitung von Big Data auf Server-Clustern. Dieser Kurs befasst sich mit der Datenverwaltung in HDFS, fortgeschrittenem Pig Hive und HBase. Diese fortgeschrittenen Programmiertechniken sind auch für erfahrene Hadoop Entwickler von Vorteil.
Zielgruppe: Entwickler
Dauer: drei Tage
Format: Vorlesungen (50%) und praktische Übungen (50%).
Hortonworks Data Platform (HDP) for Administrators
21 StundenDiese Live-Schulung mit Kursleiter in Österreich (online oder vor Ort) führt die Teilnehmer in die Hortonworks Data Platform (HDP) ein und begleitet sie durch den Einsatz der Spark + Hadoop Lösung.
Am Ende dieser Schulung werden die Teilnehmer in der Lage sein:
- Hortonworks verwenden, um Hadoop in großem Maßstab zuverlässig auszuführen.
- Die Sicherheits-, Governance- und Betriebsfunktionen von Hadoop mit den agilen analytischen Workflows von Spark zu vereinen.
- Verwenden Sie Hortonworks, um jede Komponente in einem Spark-Projekt zu untersuchen, zu validieren, zu zertifizieren und zu unterstützen.
- Verarbeiten Sie verschiedene Datentypen, einschließlich strukturierter und unstrukturierter Daten sowie Daten in Bewegung und im Ruhezustand.
Data Analysis with Hive/HiveQL
7 StundenDieser Kurs behandelt die Verwendung der Hive SQL Sprache (AKA: Hive HQL, SQL in Hive , Hive QL) für Personen, die Daten aus Hive extrahieren
Impala for Business Intelligence
21 StundenCloudera Impala ist eine quelloffene, massiv-parallele Verarbeitungs- (MPP) SQL Abfrage-Engine für Apache Hadoop-Cluster.
Mit Cloudera Impala können Benutzer Abfragen mit niedriger Latenz SQL an Daten stellen, die im Hadoop Distributed File System und in Apache Hbase gespeichert sind, ohne dass eine Datenbewegung oder -transformation erforderlich ist.
Zielgruppe
Dieser Kurs richtet sich an Analysten und Datenwissenschaftler, die Daten, die in Hadoop gespeichert sind, mit Business Intelligence oder SQL Tools analysieren.
Nach diesem Kurs werden die Teilnehmer in der Lage sein
- Aussagekräftige Informationen aus Hadoop-Clustern mit Impala zu extrahieren.
- Spezifische Programme zu schreiben, um Business Intelligence in Impala SQL Dialekt zu erleichtern.
- Fehler zu beheben Impala.
A Practical Introduction to NoSQL Databases
28 StundenRelationale Datenbanken waren die Technologie der Wahl zum Speichern, Abrufen und Abfragen von Daten. Mit relationalen Datenbanken können Benutzer ihre Daten mithilfe eines strukturierten, genau definierten Satzes von Mustern (Modell) organisieren. Dieser Ansatz eignet sich zwar gut zum Speichern von Daten, die im Voraus standardisiert und gut verstanden wurden (stellen Sie sich eine Krankenhaus-Check-in-Anwendung vor, in der Patientenakten mit denselben vordefinierten Feldern gespeichert sind ... Patienten-ID, Vorname, Nachname Name, Datum des letzten Besuchs usw.) gibt es Einschränkungen für dieses Modell. Für Organisationen, deren eingehende Daten nicht genau definiert sind (stellen Sie sich ein Online-Anfrageformular für ein Startup vor, das gerade mit verschiedenen Feldern experimentiert, um Besucherdaten zu sammeln. Entfernen und Hinzufügen von Feldern, um sie an die sich ändernde Natur der Website anzupassen Definitionen, wie die Daten in eine bestehende Datenbank passen sollen, müssten regelmäßig neu definiert werden. Dazu müsste das Datenmodell (Schema) neu erstellt werden, das die Struktur der Daten und die zulässigen Datentypen vorgibt, um verschiedene Arten von Dateneingaben usw. zu unterstützen, bevor neue Daten in der Datenbank gespeichert werden können.
Geben Sie keine SQL Datenbanken (nicht nur SQL ) ein. Keine SQL Datenbank befreit Benutzer von der Notwendigkeit, die Struktur der eingehenden Daten vorab festzulegen, sodass sie neue Daten im Handumdrehen einfügen und aktualisieren können. Keine SQL Datenbank ist oft schneller als relationale Datenbanken und kann sehr große Datenmengen problemlos verarbeiten. Keine SQL Datenbank lässt sich auch besser skalieren als relationale Datenbanken, da sie Daten effizient auf mehrere Server (Cluster) verteilen und den Zugriff auf diese Daten ausgleichen kann. Keine SQL Datenbanken lassen sich besonders gut in Anwendungen integrieren, die Echtzeitanalysen, Website-Personalisierung, IoT und mobile Apps unterstützen
In diesem von Lehrern geführten Live-Training lernen die Teilnehmer die Architektur, die Designprinzipien und die Funktionalität der beliebtesten No- SQL Datenbanken auf dem Markt kennen, während sie eine Reihe von No- SQL Datenbanken in einer Live-Laborumgebung einrichten, betreiben und bewerten. Ziel dieser Schulung ist es, die Teilnehmer in die Lage zu versetzen, eine geeignete No- SQL Datenbanklösung in ihrem Unternehmen intelligent zu bewerten, vorzuschlagen und zu implementieren.
Am Ende dieser Schulung können die Teilnehmer:
- Installieren und konfigurieren Sie verschiedene Arten von No SQL Datenbanken, einschließlich MongoDB , Cassandra , Redis und Neo4j
- Verstehen Sie die Vor- und Nachteile von No SQL Datenbanken gegenüber relationalen Datenbanken
- Verstehen Sie die zugrunde liegenden Datenformate, die von No SQL Datenbanken verwendet werden, und wie diese Formate bei der Entwicklung moderner Anwendungen (Desktop, Mobile, Cloud, IoT) vorteilhaft eingesetzt werden können.
- Erstellen, Einfügen, Aktualisieren und Löschen von Vorgängen in einer No SQL Datenbank
- Richten Sie eine gemischte Umgebung ein, in der sowohl eine relationale Datenbank als auch No SQL zusammenarbeiten
- Konfigurieren Sie einen Cluster ohne SQL Datenbank für die verteilte Verarbeitung sehr großer Datasets
- Verstehen Sie die Sicherheitsaspekte der Verwendung einer No SQL Datenbank
- Bereitstellen und Skalieren einer No SQL Datenbank in einer Produktionsumgebung
Publikum
- Database
- Datenarchitekten
- Datenstrategen
- Projektmanager
- Anwendungsentwickler, die eine flexible Datenbanklösung in ihre Anwendung integrieren möchten
Format des Kurses
- Teilvorlesung, Teildiskussion, Übungen und viel praktisches Üben
Hinweis
- Um ein individuelles Training für diesen Kurs anzufordern, kontaktieren Sie uns bitte, um dies zu arrangieren.
Scylla Database
21 StundenScylla ist ein Open-Source-verteilter No- SQL Datenspeicher. Es ist mit Apache Cassandra kompatibel, bietet jedoch deutlich höhere Durchsätze und geringere Latenzen.
In diesem Kurs lernen die Teilnehmer die Funktionen und die Architektur von Scylla kennen und erhalten praktische Erfahrungen mit der Einrichtung, Verwaltung, Überwachung und Fehlerbehebung von Scylla.
Publikum
- Database
- Entwickler
- Systemingenieure
Format des Kurses
- Der Kurs ist interaktiv und enthält Diskussionen zu den Grundsätzen und Ansätzen für die Bereitstellung und Verwaltung verteilter Scylla-Datenbanken und -Cluster.
- Der Kurs beinhaltet eine umfangreiche Komponente von praktischen Übungen und Übungen.