So installieren Sie Apache Hive mit Hadoop auf CentOS, Ubuntu und Linuxmint
- 557
- 149
- Madleen Vater
Was ist Apache Hive ? Die Apache Hive Data Warehouse -Software erleichtert das Abfragen und Verwalten großer Datensätze, die sich im verteilten Speicher befinden. Hive bietet einen Mechanismus zur Projektstruktur auf diese Daten und befragt die Daten mithilfe einer SQL-ähnlichen Sprache namens Hiveql. Lesen Sie mehr auf offizieller Website
Mit dieser Anleitung können Sie Apache Hive auf CentOS/Rhel mit Hadoop mit einfachen Schritten installieren.
Schritt 1: Installieren Sie Java und Hadoop
Apache Hive benötigte Java 6 oder später Version. Wir müssen auch Hadoop zuerst installieren, bevor wir Apache Hive in unserem System installieren. Verwenden Sie die folgenden Links, um sie zu installieren
Schritte zur Installation von Java auf CentOS und RHEL 7/6/5
Schritte zur Installation von Hadoop unter Linux
Schritt 2: Hive -Archiv herunterladen
Nachdem Hadoop erfolgreich auf Ihrem Linux -System konfiguriert wurde. Starten wir das Hive -Setup. Laden Sie zuerst den neuesten Hive -Quellcode herunter und extrahieren Sie das Archiv mit den folgenden Befehlen.
# CD/Home/Hadoop # WGet http: // Archiv.Apache.org/dist/hive/hive-0.12.0/Hive-0.12.0-bin.Teer.GZ # TAR XZF HIVE-0.12.0-bin.Teer.GZ # MV Hive-0.12.0 -im Bive # Chown -r Hadoop Hive Hive
Schritt 3: Variablen für Umgebungsumgebungen einrichten
Wechseln Sie nach dem Extrahieren der Hive -Archivdatei zu Hadoop -Benutzer und Setup folgen Umgebungsvariablen.
# Su - Hadoop $ export hadoop_home =/home/hadoop/hadoop $ export hadoop_prefix =/home/hadoop/hadoop $ export hive_home =/home/hadoop/hive $ export path = $ hive_home/bin: $ path
Schritt 4: Start Bienenstock
Vor dem Ausführen von Bienenstock müssen wir erstellen /tmp Und /Benutzer/Hive/Lagerhaus und stellen Sie sie in HDFs ein, bevor Sie eine Tabelle im Hive erstellen. Verwenden Sie die folgenden Befehle.
$ cd/home/hadoop/hive $ $ hadoop_home/bin/hadoop fs -mkdir/tmp $ $ hadoop_home/bin/hadoop fs -mkdir/user/hive/lagern $ $ hadoop_home/bin/hadoop fs -chmod g+w/ tmp $ $ hadoop_home/bin/hadoop fs -chmod g+w/user/hive/lagerhaus
Beginnen wir mithilfe von Hive mit dem folgenden Befehl.
$ bin/Hive-Protokollierung initialisiert mit Konfiguration in JAR: Datei:/home/hadoop/hive/lib/hive common-0.12.0.Krug!/Hive-Log4j.Eigenschaften Hive>
Schritt 5: Erstellen Sie Demo -Tabelle und Test
Zu diesem Zeitpunkt haben Sie den Bienenstock erfolgreich installiert. Erstellen Sie eine Beispieltabelle mit dem folgenden Befehl
Hive> Tabelle Demo1 erstellen (ID int, Name String); Ok Zeit genommen: 6.565 Sekunden
Zeigen Sie die erstellten Tabellen mit dem folgenden Befehl an.
Hive> SHOW -Tische; OK Demo1 Zeit.231 Sekunden, abgerufen: 1 Zeile (en)
Lassen Sie die Tabelle mit dem folgenden Befehl fallen.
Hive> Droptabelle Demo1; Ok Zeit genommen: 2.393 Sekunden
Lesen Sie mehr über SQL -Operationen auf Hive auf Apache Hive Official Site.
- « Fedora 20 veröffentlicht - Was ist neu in Fedora 20
- Installieren Sie die Elgg (Social Networking Platform) auf CentOS RHEL 6/5 »