Zabawa w terminalu Linux - graj z liczbą słów i postaci
- 4489
- 103
- Juliusz Sienkiewicz
Linux poleceń ma dużo zabawy w sobie i wiele żmudnych zadań można wykonać bardzo łatwo, ale z perfekcją. Gra słowami i postaciami, ich częstotliwość w pliku tekstowym itp. Jest tym, co zobaczymy w tym artykule.
Jedynym poleceniem, które przychodzi nam na myśl, aby dostosować wiersz poleceń Linux, aby manipulować słowami i znakami z pliku tekstowego, jest polecenie WC.
Zabawa ze słowami i literami w skorcieA 'toaleta„Polecenie, które oznacza liczbę słów, jest w stanie wydrukować NOWYLINE, Word i Bajt liczy się z pliku tekstowego.
Aby pracować z małymi skryptami w celu analizy pliku tekstowego, musimy mieć plik tekstowy. Aby zachować jednolitość, tworzymy plik tekstowy z poleceniem wyjściowym MAN, jak opisano poniżej.
$ Man Man> Man.tekst
Powyższe polecenie tworzy plik tekstowy 'Człowiek.tekst„Z treścią”Strona ręczna' Do 'Człowiek' Komenda.
Chcemy sprawdzić najczęstsze słowa, w wyżej utworzonymPlik tekstowy„Uruchamiając poniższy skrypt.
$ Cat Man.txt | Tr "2 '| tr' [: Upper:]" [: Lower:] '| tr -d '[: puth:]' | grep -v '[^a -z]' | SORT | uniq -c | sort -rn | głowa
Przykładowy wyjście
7557 262 163 do 112 to 112 A 78 z 78 manual 76 i 64, jeśli 63
Powyższy prosty skrypt liniowy pokazuje, dziesięć najczęściej pojawiających się słów i ich częstotliwość wyglądu, w pliku tekstowym.
Co powiesz na rozbicie słowa na osobę za pomocą następującego polecenia.
$ echo „Tecmint Team” | Fold -W1
Przykładowy wyjście
t e c m i n t e a m
Notatka: Tutaj, „-w1” jest dla szerokości.
Teraz rozbijemy każde słowo w pliku tekstowym, sortuj wynik i otrzymamy pożądane dane wyjściowe z częstotliwością dziesięciu najczęstszych znaków.
$ fold -w1 < man.txt | sort | uniq -c | sort -rn | head
Przykładowy wyjście
8579 2413 E 1987 A 1875 T 1644 I 1553 N 1522 O 1514 S 1224 R 1021 L
Co powiesz na uzyskanie najczęstszych znaków w pliku tekstowym z wielkimi i małymi literami inaczej wraz z częstotliwością występowania.
$ fold -w1 < man.txt | sort | tr '[:lower:]"[:upper:]' | uniq -c | sort -rn | head -20
Przykładowy wyjście
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 Y 344 .
Sprawdź powyższe wyjście, w którym uwzględniono znak interpunkcyjny. Pozwól, aby rozebrać interpunkcję, z 'tr' Komenda. No to ruszamy:
$ fold -w1 < man.txt | tr '[:lower:]"[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -20
Przykładowy wyjście
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1550 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 Y
Teraz mam trzy pliki tekstowe, uruchommy powyższy skrypt liniowy, aby zobaczyć wyjście.
$ cat *.txt | Fold -W1 | Tr '[: dolne:] "[: Upper:]' | sort | tr -d '[: puth:]' | uniq -c | sort -rn | head -8
Przykładowy wyjście
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O
Następnie będziemy generować te rzadkie litery, które mają co najmniej dziesięć liter. Oto prosty skrypt.
$ Cat Man.txt | Tr "2 '| tr' [: Upper:]" [: Lower:] '| tr -d '[: puth:]' | tr -d '[0-9]' | SORT | uniq -c | sort -n | grep -e '…' | głowa
Przykładowy wyjście
1 ─wiątka ───loktt .tttkalikalitowskimt Wszystkie argumenty wewnątrz są opcjonalnie 1 zdolne do zobaczenia setLocale Precyzyjne szczegóły 1 Opcje AB Ograniczone przez Razem nie można użyć razem 1 osiągnięte przy użyciu mniejszej zmiennej środowiskowej 1 proces dziecięcy zwrócił niezerowy status wyjścia 1 Działa tak, jakby ta opcja została dostarczona za pomocą nazwy jako jako nazwa pliku 1 aktywuj format trybu lokalnego i wyświetl lokalne pliki manualne 1 Ostry akcent
Notatka: Im coraz więcej kropek w powyższym skrypcie do momentu wygenerowania wszystkich wyników. Możemy użyć .10 Aby uzyskać dziesięć meczów postaci.
Te proste skrypty, sprawiają, że najczęściej się pozwala wyglądać słowami i postaciami w języku angielskim.
To wszystko na teraz. Będę tu znowu z kolejnym interesującym i poza tym, co warto wiedzieć. Nie zapomnij przekazać nam cennej informacji zwrotnej w sekcji komentarzy poniżej.
Przeczytaj także: 20 zabawnych poleceń Linuksa
- « DTRX - Inteligentna ekstrakcja archiwum (TAR, ZIP, CPIO, RPM, Deb, Rar) narzędzie dla Linux
- Jak zatrzymać i wyłączyć niechciane usługi z systemu Linux »