Spaß im Linux -Terminal - Spiel mit Wort- und Charakterzahlen spielen
- 2964
- 388
- Hr. Moritz Bozsik
Linux -Befehlszeile hat viel Spaß um sich selbst und viele mühsame Aufgaben können sehr leicht ausgeführt werden, doch perfekt. Das Spielen mit Wörtern und Charakteren, deren Frequenz in einer Textdatei usw. ist das, was wir in diesem Artikel sehen werden.
Der einzige Befehl, der uns in den Sinn kommt, um die Befehlszeile der Linux zu optimieren, um Wörter und Zeichen aus einer Textdatei zu manipulieren, ist WC -Befehl.
Spaß mit Wort und Buchstaben zählt in ShellA 'ToiletteDer Befehl, der für die Wortzahl steht.
Um mit den kleinen Skripten zu arbeiten, um die Textdatei zu analysieren, müssen wir eine Textdatei haben. Um die Einheitlichkeit aufrechtzuerhalten, erstellen wir eine Textdatei mit dem Befehl aus Ausgabe des Menschen, wie unten beschrieben.
$ MAN MAN> Mann.txt
Der obige Befehl erstellt eine Textdatei 'Mann.txt'Mit dem Inhalt von' 'Handbuch Seite' für 'Mann' Befehl.
Wir möchten die häufigsten Wörter in der oben erstellten Erstellung überprüfenTextdatei'Durch Ausführen des folgenden Skripts.
$ Cat Man.txt | tr "2 '| tr' [: obere:]" [: unter:] '| tr -D '[: punct:]' | grep -v '[^a -z]' | sortieren | Uniq -c | sortieren -rn | Kopf
Probenausgabe
7557 262 Der 163 bis 112 ist 112 A 78 von 78 Handbuch 76 und 64, wenn 63 sein
Das obige Ein -Liner -Skript zeigt in der Textdatei, zehn erscheinen Wörter und deren Häufigkeit des Erscheinungsbildes am häufigsten an.
Wie wäre?.
$ echo 'Tecmint -Team' | falten -w1
Probenausgabe
t e c m i n t e a m
Notiz: Hier ist '-W1' für die Breite.
Jetzt werden wir jedes einzelne Wort in einer Textdatei aufbrechen, das Ergebnis sortieren und die gewünschte Ausgabe mit der Häufigkeit von zehn häufigsten Zeichen erhalten.
$ fold -W1 < man.txt | sort | uniq -c | sort -rn | head
Probenausgabe
8579 2413 E 1987 A 1875 T 1644 I 1553 N 1522 O 1514 S 1224 R 1021 L
Wie wäre es, die häufigsten Zeichen in der Textdatei mit Großbuchstaben und Kleinbuchstaben anders zu erhalten, zusammen mit ihrer Vorkommensfrequenz.
$ fold -W1 < man.txt | sort | tr '[:lower:]"[:upper:]' | uniq -c | sort -rn | head -20
Probenausgabe
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 U 605 F 504 G 352 y 344 .
Überprüfen Sie die obige Ausgabe, bei der die Zeichensetzung Marke enthalten ist. Lassen Sie uns Interpunktion mit 'mit' ausziehentr' Befehl. Auf geht's:
$ fold -W1 < man.txt | tr '[:lower:]"[:upper:]' | sort | tr -d '[:punct:]' | uniq -c | sort -rn | head -20
Probenausgabe
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O 1550 1269 R 1055 L 836 H 791 P 766 D 753 C 725 M 690 u 605 F 504 G 352 y
Jetzt habe ich drei Textdateien, wir können das obige Ein -Liner -Skript ausführen, um die Ausgabe anzuzeigen.
$ cat *.txt | falten -w1 | tr '[: unter:] "[: obere:]' | sort | tr -d '[: punct:]' | uniq -c | sort -rn | Kopf -8
Probenausgabe
11636 2504 E 2079 A 2005 T 1729 I 1645 N 1632 S 1580 O
Als nächstes werden wir die seltenen Buchstaben erstellen, die mindestens zehn Buchstaben lang sind. Hier ist das einfache Skript.
$ Cat Man.txt | tr "2 '| tr' [: obere:]" [: unter:] '| tr -D '[: punct:]' | tr -D '[0-9]' | sortieren | Uniq -c | sortieren -n | grep -e '...' | Kopf
Probenausgabe
1 ──schung Alle Argumente innerhalb sind optional 1 In der Lage, SetLocale für präzise Details 1 AB -Optionen zu vergrößern, kann nicht zusammen verwendet werden Ein Dateiname 1 Aktivieren Sie das lokale Modusformat und zeigen Sie lokale manuelle Dateien an. 1 Akuter Akzent
Notiz: Je mehr Punkte im obigen Skript bis alle Ergebnisse generiert werden. Wir können benutzen .10, um zehn Zeichen Matches zu erhalten.
Diese einfachen Skripte machen uns auch wissen, dass wir am häufigsten erscheinen Wörter und Charaktere in Englisch.
Das ist alles fürs Erste. Ich werde wieder mit einem weiteren interessanten und außerhalb des Beat -Themas hier sein, von dem Sie die Leute gerne lesen werden. Vergessen Sie nicht, uns unten Ihr wertvolles Feedback im Kommentarbereich zu geben.
Lesen Sie auch: 20 lustige Befehle von Linux
- « DTRX - Eine intelligente Archivextraktion (TAR, ZIP, CPIO, RPM, DEB, RAR) Tool für Linux
- So stoppen und deaktivieren Sie unerwünschte Dienste vom Linux -System »