Benutzer:Andreas Plank/Hilfreiche Kommandos für Text-Suche oder Text-Prozessierung (Linux): Unterschied zwischen den Versionen

Version vom 26. Mai 2022, 19:46 Uhr

Nur die ersten 3 Textfunde ausgeben und mehr nicht (hier XML-Beispiel):

cat Eine-RDF-oder-XML-Datei.rdf | awk '/<\?xml/ {zaehlefund++; if(zaehlefund>3){auszugeben=0}else{auszugeben=1}}; auszugeben {print};'
# Such-Übereinstimmung abgezählt ausgeben (bis zum 3. Mal)
cat A-RDF-or-XML-file.rdf | awk '/<\?xml/ {countxml++; if(countxml>3){printing=0}else{printing=1}}; printing {print};'
# count search match and print it until the 3rd time

Telegram-Plausch Such-Marker

Suchmarker eines Telegram-Kanals herauslesen (und durchzählen):

mit Telegram-Desktop-Programm ein „Chatexport“ ausführen lassen (das HTML ist hinreichend genug)
Speicherpfad ggf. im Skript anpassen (hier liegt aller Plausch/Geschreibe (Chat) im persönlichen Verzeichnis ~/Heruntergeladen/Telegram\ Desktop/ChatExport_2022-05-26 vor jeweils die messages*.html)

# sed: finde alle <a>#…</a>, stelle Suchmarker:
# sed --silent --regexp-extended oder kurz sed -nr
sed -nr '# stillschweigend suchen
  s@>(#[^<>]+)</a>@\nSuch-Marker: \1\n@gp; 
  # suche <a>#…</a> 
  # → ersetze: \nSuch-Marker: #gefundener-Suchmarker\n
  # gp → g=globales Suchen, p=print, Ersetzung ausgeben
' ~/Heruntergeladen/Telegram\ Desktop/ChatExport_2022-05-26/messages*.html \
  | grep -i 'Such-Marker' \
  | sort | uniq --count | sort -k3 \
  > ~/Kanal-xy-Such-Marker_$(date '+%Y%m%d-%H%M').txt
  # sort         → vorsortieren
  # uniq --count → einzelich machen aber zusammenzählen
  # sort -k3     → zusammenzählte Ergebnisse nach 3. Spalte (die Suchmarker-Spalte) sortieren

Benutzer:Andreas Plank/Hilfreiche Kommandos für Text-Suche oder Text-Prozessierung (Linux): Unterschied zwischen den Versionen

Version vom 26. Mai 2022, 19:46 Uhr

Telegram-Plausch Such-Marker

Navigationsmenü

Suche