Zabawa w terminalu Linux - graj z liczbą słów i postaci

Zabawa w terminalu Linux - graj z liczbą słów i postaci

Linux poleceń ma dużo zabawy w sobie i wiele żmudnych zadań można wykonać bardzo łatwo, ale z perfekcją. Gra słowami i postaciami, ich częstotliwość w pliku tekstowym itp. Jest tym, co zobaczymy w tym artykule.

Jedynym poleceniem, które przychodzi nam na myśl, aby dostosować wiersz poleceń Linux, aby manipulować słowami i znakami z pliku tekstowego, jest polecenie WC.

Zabawa ze słowami i literami w skorcie

A 'toaleta„Polecenie, które oznacza liczbę słów, jest w stanie wydrukować NOWYLINE, Word i Bajt liczy się z pliku tekstowego.

Aby pracować z małymi skryptami w celu analizy pliku tekstowego, musimy mieć plik tekstowy. Aby zachować jednolitość, tworzymy plik tekstowy z poleceniem wyjściowym MAN, jak opisano poniżej.

$ Man Man> Man.tekst

Powyższe polecenie tworzy plik tekstowy 'Człowiek.tekst„Z treścią”Strona ręczna' Do 'Człowiek' Komenda.

Chcemy sprawdzić najczęstsze słowa, w wyżej utworzonymPlik tekstowy„Uruchamiając poniższy skrypt.

$ Cat Man.txt | Tr "2 '| tr' [: Upper:]" [: Lower:] '| tr -d '[: puth:]' | grep -v '[^a -z]' | SORT | uniq -c | sort -rn | głowa
Przykładowy wyjście
7557 262 163 do 112 to 112 A 78 z 78 manual 76 i 64, jeśli 63

Powyższy prosty skrypt liniowy pokazuje, dziesięć najczęściej pojawiających się słów i ich częstotliwość wyglądu, w pliku tekstowym.

Co powiesz na rozbicie słowa na osobę za pomocą następującego polecenia.

$ echo „Tecmint Team” | Fold -W1
Przykładowy wyjście
t e c m i n t e a m

Notatka: Tutaj, „-w1” jest dla szerokości.

Teraz rozbijemy każde słowo w pliku tekstowym, sortuj wynik i otrzymamy pożądane dane wyjściowe z częstotliwością dziesięciu najczęstszych znaków.

$ fold -w1 < man.txt | sort | uniq -c | sort -rn | head
Przykładowy wyjście
8579 2413 E 1987 A 1875 T 1644 I 1553 N 1522 O 1514 S 1224 R 1021 L

Co powiesz na uzyskanie najczęstszych znaków w pliku tekstowym z wielkimi i małymi literami inaczej wraz z częstotliwością występowania.

$ fold -w1 < man.txt | sort | tr '[:lower:]"[:upper:]' | uniq -c | sort -rn | head -20
Przykładowy wyjście
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 Y 344 .

Sprawdź powyższe wyjście, w którym uwzględniono znak interpunkcyjny. Pozwól, aby rozebrać interpunkcję, z 'tr' Komenda. No to ruszamy:

$ fold -w1 < man.txt | tr '[:lower:]"[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -20
Przykładowy wyjście
 11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1550 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 Y

Teraz mam trzy pliki tekstowe, uruchommy powyższy skrypt liniowy, aby zobaczyć wyjście.

$ cat *.txt | Fold -W1 | Tr '[: dolne:] "[: Upper:]' | sort | tr -d '[: puth:]' | uniq -c | sort -rn | head -8
Przykładowy wyjście
 11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O

Następnie będziemy generować te rzadkie litery, które mają co najmniej dziesięć liter. Oto prosty skrypt.

$ Cat Man.txt | Tr "2 '| tr' [: Upper:]" [: Lower:] '| tr -d '[: puth:]' | tr -d '[0-9]' | SORT | uniq -c | sort -n | grep -e '…' | głowa
Przykładowy wyjście
1 ─wiątka ───loktt .tttkalikalitowskimt Wszystkie argumenty wewnątrz są opcjonalnie 1 zdolne do zobaczenia setLocale Precyzyjne szczegóły 1 Opcje AB Ograniczone przez Razem nie można użyć razem 1 osiągnięte przy użyciu mniejszej zmiennej środowiskowej 1 proces dziecięcy zwrócił niezerowy status wyjścia 1 Działa tak, jakby ta opcja została dostarczona za pomocą nazwy jako jako nazwa pliku 1 aktywuj format trybu lokalnego i wyświetl lokalne pliki manualne 1 Ostry akcent

Notatka: Im coraz więcej kropek w powyższym skrypcie do momentu wygenerowania wszystkich wyników. Możemy użyć .10 Aby uzyskać dziesięć meczów postaci.

Te proste skrypty, sprawiają, że najczęściej się pozwala wyglądać słowami i postaciami w języku angielskim.

To wszystko na teraz. Będę tu znowu z kolejnym interesującym i poza tym, co warto wiedzieć. Nie zapomnij przekazać nam cennej informacji zwrotnej w sekcji komentarzy poniżej.

Przeczytaj także: 20 zabawnych poleceń Linuksa