Benutzer:Andreas Plank/Technische Hilfe für Literaturverwaltung

Aus Open Source Ecology - Germany
< Benutzer:Andreas Plank
Version vom 27. März 2022, 16:35 Uhr von Andreas Plank (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „== PDF Dateien == Voraussetzung: Linuxprogramm <code>pdftk</code> Alle Lesezeichen oder „Überschriften der Seitenstruktur“ aus einer PDF-Datei herausles…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

PDF Dateien

Voraussetzung: Linuxprogramm pdftk

Alle Lesezeichen oder „Überschriften der Seitenstruktur“ aus einer PDF-Datei herauslesen:

pdftk "Langbein - 1841 - Gedichte.pdf" dump_data_utf8 | grep '^BookmarkTitle\|^BookmarkPageNumber' | sed --regexp-extended '/BookmarkTitle/{N; s@BookmarkTitle: @@; s@\nBookmarkPageNumber: ([0-9]+)@ (Seite \1)@; /Front Cover/d } '

Beispielergebnis:

Richard Löwenherz und Blondel  (Seite 44)
Der junge Landmann  (Seite 57)
Warnung  (Seite 70)
Die lange Predigt  (Seite 83)
Die neue Eva  (Seite 96)
Die unglücliden Bogelſteller  (Seite 110)
…