Tworzenie katalogu w HDFS i plikach kopiowania (Hadoop)
- 2669
- 778
- Pan Jeremiasz Więcek
HDFS jest Hadoop rozproszony system plików. Jest to rozproszony system przechowywania dla dużych zestawów danych, który obsługuje tolerancję błędów, wysoką przepustowość i skalowalność. Działa poprzez podzielenie danych na bloki, które są replikowane na wiele maszyn w klastrze. Bloki można zapisać lub odczytać równolegle, ułatwiając wysoką przepustowość i tolerancję na uszkodzenia. HDFS zapewnia redundancję przypominającą RAID z automatycznym przełączaniem awaryjnym. HDFS obsługuje również kompresję, replikację i szyfrowanie.
Najczęstszym przypadkiem użycia dla HDFS jest przechowywanie dużych kolekcji danych, takich jak pliki obrazu i wideo, dzienniki, dane czujników itd.
Tworzenie struktury katalogu z HDFS
Narzędzie wiersza poleceń „HDFS” jest dostępne w ramach $ Hadoop_home/bin informator. Zakładając, że katalog Hadoop Bin jest już uwzględniony ŚCIEŻKA Zmienna środowiskowa. Teraz zaloguj się jako użytkownik Hadoop i postępuj zgodnie z instrukcjami.
- Stwórz /dane katalog w systemie plików HDFS. Jestem gotów użyć tego katalogu, aby zawierać wszystkie dane z aplikacji.
HDFS DFS -MKDIR /Data
- Tworzenie innego katalogu /var/log, który zawiera wszystkie pliki dziennika. Ponieważ katalog /var również nie istnieje, używaj
-P
Aby utworzyć również katalog nadrzędny.HDFS dfs -mkdir -p /var /log
- Możesz także używać zmiennych podczas tworzenia katalogu. Na przykład tworzenie katalogu o tej samej nazwie co aktualnie zarejestrowany użytkownik. Ten katalog można użyć do zawierania danych użytkownika.
HDFS DFS -MKDIR -p /Users /$ użytkownik
Zmiana uprawnień do plików z HDFS
Możesz także zmienić właściciele plików, a także uprawnienia w systemie plików HDFS.
- Aby zmienić właściciela pliku i właściciel grupy, użyj
-Chown
Opcja wiersza poleceń:HDFS dfs -Chown -r $ hadoop_user: $ hadoop_user /Users /Hadoop
- Aby zmienić zgodę pliku, użyj
-chmod
Opcje wiersza poleceń.HDFS DFS -Chmod -r 775 /Users /Hadoop
Kopiowanie plików do HDFS
HDFS Polecenie zapewnia -Dostawać
I -umieścić
Parametry do kopiowania plików do/z systemu plików HDFS.
- Na przykład, aby skopiować pojedynczy plik z systemu plików lokalnego do HDFS:
HDFS DFS -PUT ~/TESTFILE.txt/var/log/
- Skopiuj wiele plików, podobnie jak drzewo katalogowe przy użyciu znaków wieloznacznych.
HDFS dfs -put ~/log/*/var/log/
Wymień pliki w HDFS
Podczas pracy z klastrem Hadoop możesz wyświetlić pliki w systemie plików HDFS za pośrednictwem wiersza poleceń, a także GUI.
- Użyj
-LS
Opcja z HDFS do wyświetlania plików w systemie plików HDFS. Na przykład, aby wymienić wszystkie pliki w katalogu głównym, użyj:HDFS DFS -LS /
- To samo polecenie może być używane do wymienienia plików z podlokatorów.
HDFS DFS -LS /Użytkownicy /Hadoop
Powinieneś uzyskać następujące dane wyjściowe:
Wypisz pliki w HDFS
- Zamiast wiersza poleceń Hadoop zapewnia również graficzny eksplorator do łatwego przeglądania, pobierania i przesyłania plików. Przejrzyj system plików HDFS w porcie Namenode w następującym adresie URL:
http: // localhost: 9870/explorer.html
Przeglądaj pliki w HDFS
Wniosek
HDFS obsługuje również szereg innych aplikacji, takich jak MapReduce Zadania przetwarzające duże ilości danych, a także mechanizmy uwierzytelniania użytkownika i kontroli dostępu. HDFS można również łączyć z innymi rozproszonymi systemami plików, takimi jak S3 i SWIFT, aby stworzyć hybrydowe roztwory chmurowe, które łączą wysoką dostępność i niskie opóźnienia z tanim przechowywaniem.
W tym artykule dowiedziałeś się o tworzeniu struktury katalogu w systemie plików HDFS, zmianie uprawnień oraz kopiowaniu i wymienienia plików z HDFS.