So installieren Sie Apache Hive mit Hadoop auf CentOS, Ubuntu und Linuxmint

So installieren Sie Apache Hive mit Hadoop auf CentOS, Ubuntu und Linuxmint

Was ist Apache Hive ? Die Apache Hive Data Warehouse -Software erleichtert das Abfragen und Verwalten großer Datensätze, die sich im verteilten Speicher befinden. Hive bietet einen Mechanismus zur Projektstruktur auf diese Daten und befragt die Daten mithilfe einer SQL-ähnlichen Sprache namens Hiveql. Lesen Sie mehr auf offizieller Website

Mit dieser Anleitung können Sie Apache Hive auf CentOS/Rhel mit Hadoop mit einfachen Schritten installieren.

Schritt 1: Installieren Sie Java und Hadoop

Apache Hive benötigte Java 6 oder später Version. Wir müssen auch Hadoop zuerst installieren, bevor wir Apache Hive in unserem System installieren. Verwenden Sie die folgenden Links, um sie zu installieren

Schritte zur Installation von Java auf CentOS und RHEL 7/6/5
Schritte zur Installation von Hadoop unter Linux

Schritt 2: Hive -Archiv herunterladen

Nachdem Hadoop erfolgreich auf Ihrem Linux -System konfiguriert wurde. Starten wir das Hive -Setup. Laden Sie zuerst den neuesten Hive -Quellcode herunter und extrahieren Sie das Archiv mit den folgenden Befehlen.

# CD/Home/Hadoop # WGet http: // Archiv.Apache.org/dist/hive/hive-0.12.0/Hive-0.12.0-bin.Teer.GZ # TAR XZF HIVE-0.12.0-bin.Teer.GZ # MV Hive-0.12.0 -im Bive # Chown -r Hadoop Hive Hive 

Schritt 3: Variablen für Umgebungsumgebungen einrichten

Wechseln Sie nach dem Extrahieren der Hive -Archivdatei zu Hadoop -Benutzer und Setup folgen Umgebungsvariablen.

# Su - Hadoop $ export hadoop_home =/home/hadoop/hadoop $ export hadoop_prefix =/home/hadoop/hadoop $ export hive_home =/home/hadoop/hive $ export path = $ hive_home/bin: $ path 

Schritt 4: Start Bienenstock

Vor dem Ausführen von Bienenstock müssen wir erstellen /tmp Und /Benutzer/Hive/Lagerhaus und stellen Sie sie in HDFs ein, bevor Sie eine Tabelle im Hive erstellen. Verwenden Sie die folgenden Befehle.

$ cd/home/hadoop/hive $ $ hadoop_home/bin/hadoop fs -mkdir/tmp $ $ hadoop_home/bin/hadoop fs -mkdir/user/hive/lagern $ $ hadoop_home/bin/hadoop fs -chmod g+w/ tmp $ $ hadoop_home/bin/hadoop fs -chmod g+w/user/hive/lagerhaus 

Beginnen wir mithilfe von Hive mit dem folgenden Befehl.

$ bin/Hive-Protokollierung initialisiert mit Konfiguration in JAR: Datei:/home/hadoop/hive/lib/hive common-0.12.0.Krug!/Hive-Log4j.Eigenschaften Hive> 

Schritt 5: Erstellen Sie Demo -Tabelle und Test

Zu diesem Zeitpunkt haben Sie den Bienenstock erfolgreich installiert. Erstellen Sie eine Beispieltabelle mit dem folgenden Befehl

Hive> Tabelle Demo1 erstellen (ID int, Name String); Ok Zeit genommen: 6.565 Sekunden 

Zeigen Sie die erstellten Tabellen mit dem folgenden Befehl an.

Hive> SHOW -Tische; OK Demo1 Zeit.231 Sekunden, abgerufen: 1 Zeile (en) 

Lassen Sie die Tabelle mit dem folgenden Befehl fallen.

Hive> Droptabelle Demo1; Ok Zeit genommen: 2.393 Sekunden 

Lesen Sie mehr über SQL -Operationen auf Hive auf Apache Hive Official Site.