Jak zainstalować Apache Hive z Hadoop na Centos, Ubuntu i LinuxMint

Jak zainstalować Apache Hive z Hadoop na Centos, Ubuntu i LinuxMint

Co to jest Apache Hive ? Apache Hive Data Warehouse Software ułatwia zapytanie i zarządzanie dużymi zestawami danych przebywających w rozproszonej pamięci. Hive zapewnia mechanizm projektu struktury na tych danych i zapytania o dane za pomocą języka podobnego do SQL o nazwie HiveQL. Przeczytaj więcej na oficjalnej stronie

Ten przewodnik pomoże Ci zainstalować Apache Hive na Centos/Rhel z Hadoop z łatwymi krokami.

Krok 1: Zainstaluj Java i Hadoop

Apache Hive wymagana Java 6 lub nowsza wersja. Musimy również najpierw zainstalować Hadoop przed zainstalowaniem Apache Hive w naszym systemie. Użyj poniżej linków, aby je zainstalować

Kroki do zainstalowania Java na CentoS i RHEL 7/6/5
Kroki do zainstalowania Hadoop na Linux

Krok 2: Pobierz archiwum Hive

Po pomyślnym skonfigurowaniu Hadoop w systemie Linux. Rozpocznijmy konfigurację ula. Najpierw pobierz najnowszy kod źródłowy Hive i wyodrębnij archiwum za pomocą następujących poleceń.

# cd/home/hadoop # wget http: // archiwum.Apache.org/dist/hive/hive-0.12.0/Hive-0.12.0-bin.smoła.GZ # TAR XZF HIVE-0.12.0-bin.smoła.GZ # MV Hive-0.12.0 -bin hive # chown -r hadoop hive 

Krok 3: Zmienne konfiguracji środowiska

Po wyodrębnienie pliku archiwum Hive, przełącz na użytkownika Hadoop i skonfiguruj następujące zmienne środowiskowe.

# su - hadoop $ eksport hadoop_home =/home/hadoop/hadoop $ eksport hadoop_prefix =/home/hadoop/hadoop $ export hive_home =/homeop/hive $ eksport = $ hive_home/bin: $ ścieżka 

Krok 4: Rozpocznij ula

Przed uruchomieniem Hive musimy stworzyć /TMP I /użytkownik/hive/magazyn i ustaw je chmod g+w w HDFS przed utworzeniem tabeli w Hive. Użyj następujących poleceń.

$ cd/home/hadoop/hive $ $ hadoop_home/bin/hadoop fs -mkdir/tmp $ $ hadoop_home/bin/hadoop fs -mkdir/użytkownik/hive/hequushe tmp $ $ hadoop_home/bin/hadoop fs -Chmod g+w/użytkownik/hive/magazyn 

Zacznijmy używać ula za pomocą następującego polecenia.

$ bin/hive logowanie zainicjowane przy użyciu konfiguracji w słoiku:/plik:/home/hadoop/hive/lib/hive-common-0.12.0.słoik!/Hive-Log4J.właściwości Hive> 

Krok 5: Utwórz tabelę demo i testuj

Na tym etapie pomyślnie zainstalowałeś Hive. Utwórzmy przykładową tabelę za pomocą następującego polecenia

Hive> Utwórz tabelę demo1 (id int, nazwa ciąg); Ok Czas poświęcony: 6.565 sekund 

Pokaż utworzone tabele z poniższym poleceniem.

Hive> Pokaż tabele; OK Demo1 Czas: 0.231 sekund, pobrane: 1 rząd (y) 

Upuść tabelę za pomocą komendy poniżej.

Hive> Demo stolika DEMO1; Ok, czas poświęcony: 2.393 sekundy 

Przeczytaj więcej o operacjach SQL w Hive na oficjalnej stronie Apache Hive.