So installieren Sie Apache Hive mit Hadoop auf CentOS, Ubuntu und Linuxmint

596
149
Madleen Vater

Was ist Apache Hive ? Die Apache Hive Data Warehouse -Software erleichtert das Abfragen und Verwalten großer Datensätze, die sich im verteilten Speicher befinden. Hive bietet einen Mechanismus zur Projektstruktur auf diese Daten und befragt die Daten mithilfe einer SQL-ähnlichen Sprache namens Hiveql. Lesen Sie mehr auf offizieller Website

Mit dieser Anleitung können Sie Apache Hive auf CentOS/Rhel mit Hadoop mit einfachen Schritten installieren.

Schritt 1: Installieren Sie Java und Hadoop

Apache Hive benötigte Java 6 oder später Version. Wir müssen auch Hadoop zuerst installieren, bevor wir Apache Hive in unserem System installieren. Verwenden Sie die folgenden Links, um sie zu installieren

Schritte zur Installation von Java auf CentOS und RHEL 7/6/5
Schritte zur Installation von Hadoop unter Linux

Schritt 2: Hive -Archiv herunterladen

Nachdem Hadoop erfolgreich auf Ihrem Linux -System konfiguriert wurde. Starten wir das Hive -Setup. Laden Sie zuerst den neuesten Hive -Quellcode herunter und extrahieren Sie das Archiv mit den folgenden Befehlen.

# CD/Home/Hadoop # WGet http: // Archiv.Apache.org/dist/hive/hive-0.12.0/Hive-0.12.0-bin.Teer.GZ # TAR XZF HIVE-0.12.0-bin.Teer.GZ # MV Hive-0.12.0 -im Bive # Chown -r Hadoop Hive Hive

Schritt 3: Variablen für Umgebungsumgebungen einrichten

Wechseln Sie nach dem Extrahieren der Hive -Archivdatei zu Hadoop -Benutzer und Setup folgen Umgebungsvariablen.

# Su - Hadoop $ export hadoop_home =/home/hadoop/hadoop $ export hadoop_prefix =/home/hadoop/hadoop $ export hive_home =/home/hadoop/hive $ export path = $ hive_home/bin: $ path

Schritt 4: Start Bienenstock

Vor dem Ausführen von Bienenstock müssen wir erstellen /tmp Und /Benutzer/Hive/Lagerhaus und stellen Sie sie in HDFs ein, bevor Sie eine Tabelle im Hive erstellen. Verwenden Sie die folgenden Befehle.

$ cd/home/hadoop/hive $ $ hadoop_home/bin/hadoop fs -mkdir/tmp $ $ hadoop_home/bin/hadoop fs -mkdir/user/hive/lagern $ $ hadoop_home/bin/hadoop fs -chmod g+w/ tmp $ $ hadoop_home/bin/hadoop fs -chmod g+w/user/hive/lagerhaus

Beginnen wir mithilfe von Hive mit dem folgenden Befehl.

$ bin/Hive-Protokollierung initialisiert mit Konfiguration in JAR: Datei:/home/hadoop/hive/lib/hive common-0.12.0.Krug!/Hive-Log4j.Eigenschaften Hive>

Schritt 5: Erstellen Sie Demo -Tabelle und Test

Zu diesem Zeitpunkt haben Sie den Bienenstock erfolgreich installiert. Erstellen Sie eine Beispieltabelle mit dem folgenden Befehl

Hive> Tabelle Demo1 erstellen (ID int, Name String); Ok Zeit genommen: 6.565 Sekunden

Zeigen Sie die erstellten Tabellen mit dem folgenden Befehl an.

Hive> SHOW -Tische; OK Demo1 Zeit.231 Sekunden, abgerufen: 1 Zeile (en)

Lassen Sie die Tabelle mit dem folgenden Befehl fallen.

Hive> Droptabelle Demo1; Ok Zeit genommen: 2.393 Sekunden

Lesen Sie mehr über SQL -Operationen auf Hive auf Apache Hive Official Site.

So installieren Sie Apache Hive mit Hadoop auf CentOS, Ubuntu und Linuxmint

Schritt 1: Installieren Sie Java und Hadoop

Schritt 2: Hive -Archiv herunterladen

Schritt 3: Variablen für Umgebungsumgebungen einrichten

Schritt 4: Start Bienenstock

Schritt 5: Erstellen Sie Demo -Tabelle und Test

Beste Artikel

12 Beste Linux -Serververteilungen von 2023

Dieser Artikel zeigt die Top 12 Linux -Serververteilungen basierend auf Rechenzentrumsfunktionen und...

So sichern und wiederherstellen Sie eine PostgreSQL -Datenbank

In diesem Artikel erfahren Sie, wie Sie eine PostgreSQL -Datenbank unter Linux sichern und wiederher...