Postscript- und PDF-Dokumente durchsuchen



Ähnliche Dokumente
Postscript- und PDF-Dokumente durchsuchen

grep everything Suchen in Anwendungsformaten

Navigation. Drucken Klicken Sie auf ein Symbol, um nähere Informationen zu erhalten. Papierhandhabung Anzeigen der Online-Informationen

PDF- und PostScript-Dokumente nachbearbeiten

6 Bilder und Dokumente verwalten

Serien- mit oder ohne Anhang

Inhaltsverzeichnis Seite

1. Allgemein Speichern und Zwischenspeichern des Designs Auswahl der zu bearbeitenden Seite Text ergänzen Textgrösse ändern 3

Was ist PDF? Portable Document Format, von Adobe Systems entwickelt Multiplattformfähigkeit,

Anleitung für die Formularbearbeitung

Schneller und sicherer Surfen im Internet

Referenzen Typo3. Blog der Internetagentur Irma Berscheid-Kimeridze Stand: Juni 2015

Downloadfehler in DEHSt-VPSMail. Workaround zum Umgang mit einem Downloadfehler

Das Modul Hilfsmittel ermöglicht den Anwender die Verwaltung der internen Nachrichten, Notizen, Kontakte, Aufgaben und Termine.

1. Einführung. 2. Die Mitarbeiterübersicht

Handbuch. Visitenkarten

Anleitung für Kunden zum Umgang mit verschlüsselten s von der LASA Brandenburg GmbH

Ein PDF erstellen. aus Adobe InDesign CC. Langner Marketing Unternehmensplanung Metzgerstraße Reutlingen

Drucken, Mailen und Exportieren mit SAP WebGui

Angaben zu einem Kontakt...1 So können Sie einen Kontakt erfassen...4 Was Sie mit einem Kontakt tun können...7

Hilfe bei Adobe Reader. Internet Explorer 8 und 9

Der digitale. Workflow Workflow. [PDF-Erstellung aus CorelDraw für Windows]

Inhaltsverzeichnis Dokumentverwaltung Organisation von Dokumenten Ordner erstellen Dokumente im Dateisystem behandeln...

1 Dokumentenmanagement

Lehrer: Einschreibemethoden

Anleitung zur Erstellung eines PDF/A1b-konformen Dokuments aus einer PDF-Datei

Erstellung von High-End-PDFs

APIS Benutzertreffen Tipps und Tricks vom APIS Support

Druck von bzw. Scan auf USB-Stick

Installationshinweise und Systemvoraussetzungen

Bedienungsanleitung BITel WebMail

Mediator 9 - Lernprogramm

teischl.com Software Design & Services e.u. office@teischl.com

So geht s Schritt-für-Schritt-Anleitung

ARCHIV- & DOKUMENTEN- MANAGEMENT-SERVER DATEIEN ARCHIVIEREN

Dokumentation Externe Anzeige von Evento Web Dialogen

Mit der Maus im Menü links auf den Menüpunkt 'Seiten' gehen und auf 'Erstellen klicken.

Bilder für LaTeX mit GIMP. Hartmut Noack Frank Hofmann

2. Word-Dokumente verwalten

Einrichten des Elektronischen Postfachs

Ordner Berechtigung vergeben Zugriffsrechte unter Windows einrichten

Anleitung zur Installation eines PostScript-Druckertreibers

Kundeninformation PDF-Erzeugung in Adobe Illustrator, Adobe InDesign und QuarkXPress Datenprüfung und Datenübergabe

Einfache und effiziente Zusammenarbeit in der Cloud. EASY-PM Office Add-Ins Handbuch

PDF- bzw. PS-Datei erzeugen mit Word + Acrobat 6/7 unter Windows XP/2000 1

Online-Hilfe. Wie kann die Online-Hilfe des SIMOTION-Scout genutzt werden, ohne Scout zu starten?

Korrekturen von Hand ausgeführt, per Post oder als Scan an Sie übermittelt.

IDA ICE - Konvertieren und Importieren von mit TRY_Effekte_aufpraegen.exe erzeugten Datensätzen

Internetauftritt von Lotta Karotta Anleitung zur Pflege. 2 Bearbeiten eines Menüpunktes am Beispiel Test

Erstellen einer PostScript-Datei unter Windows XP

Medea3 Print-Client (m3_print)

Verwenden von Adobe LiveCycle ES3 Connector für Microsoft SharePoint

Erstellen von Mailboxen

Handbuch zur Anlage von Turnieren auf der NÖEV-Homepage

Anleitung für die Hausverwaltung

PDF-Druck und PDF-Versand mit PV:MANAGER

Anzeige von eingescannten Rechnungen

Anleitung zum erstellen einer PDF-Datei aus Microsoft Word

ACDSee 10. ACDSee 10: Fotos gruppieren und schneller durchsuchen. Was ist Gruppieren? Fotos gruppieren. Das Inhaltsverzeichnis zum Gruppieren nutzen

Tutorial: Wie kann ich Dokumente verwalten?

Erstellen einer digitalen Signatur für Adobe-Formulare

Medienkompass1, Lehrmittelverlag des Kantons Zürich, 1. Ausgabe 2008, Thema 13 Sicher ist sicher, S.58-61

4.1 Wie bediene ich das Webportal?

So empfangen Sie eine verschlüsselte von Wüstenrot

Handbuch ECDL 2003 Basic Modul 3: Textverarbeitung Dokument bearbeiten und speichern

impact ordering Info Produktkonfigurator

BlackBerry Bridge. Version: 3.0. Benutzerhandbuch

Erweitertes Kalkulationsfenster

Vereinsverwaltung DFBnet Verein. Anleitung Familienbeiträge und Gemeinschaften

Einfügen von Bildern innerhalb eines Beitrages

Leichte-Sprache-Bilder

BESCHNITTZUGABE EINSTELLUNGEN

Gesicherte Prozeduren

der Firma BuchLogistikCompany GmbH Erstellt von Bernhard Neidl

DIE SUCHFUNKTION VON WINDOWS 7

Dokumentation für die software für zahnärzte der procedia GmbH Onlinedokumentation

OUTLOOK-DATEN SICHERN

Einführung in LINUX Der Editor vi

KURZANLEITUNG CLOUD OBJECT STORAGE

Erstellen von PDF-Dateien aus bocad-3d in der Version 19.xxxx und 20.xxxx

Kurz-Anleitung. Die wichtigsten Funktionen. Das neue WEB.DE - eine Übersicht. s lesen. s schreiben. Neue Helfer-Funktionen

Dieses Dokument soll dem Administrator helfen, die ENiQ-Software als Client auf dem Zielrechner zu installieren und zu konfigurieren.

virtuos Leitfaden für die virtuelle Lehre

Mitgliederbereich. Login. Werbemittel-Shop. Broschüren-Baukasten. Bilder-Datenbank. Zentralverband des des Deutschen Dachdeckerhandwerks e.v. e.v.

Gibt Daten im erweiterten Format aus. Dies beinhaltet die Angabe von Zugriffsrechten, Besitzer, Länge, Zeitpunkt der letzten Änderung und mehr.

e-books aus der EBL-Datenbank

Kurzeinführung Excel2App. Version 1.0.0

Task: Nmap Skripte ausführen

Dialyse Benchmark - Online so funktioniert s

SHAREPOINT Unterschiede zwischen SharePoint 2010 & 2013

Datenbanken auf Sybase SQL-Anywhere

ID VisitControl. Dokumentation Administration Equitania Software GmbH cmc Gruppe Seite 1

Das neue Tech Data Software Download Portal

QuarkCopyDesk Bekannte und behobene Probleme. Letzte Aktualisierung: 1/8/2014

Drucken an der ULB Münster mit Print & Pay

OrgPublisher. browserübergreifende. Diagramme

Anleitung zur Updateinstallation von ElsaWin 4.00

Transkript:

Postscript- und PDF-Dokumente durchsuchen Frank Hofmann 10. Juni 2012 Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 1 / 18

Inhalt 1 Über den Referenten 2 Informationen wiederfinden 3 Aufbau der Formate PostScript und PDF 4 PostScript-Dateien durchsuchen 5 PDF-Dateien durchsuchen 6 Schlussworte Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 2 / 18

Über den Referenten Frank Hofmann OpenSource-Aktivitäten und Projekte 2000-2007 seit 2009 seit 2006 Regionales LUG-Treffen Berlin- Brandenburg seit 2008 Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 3 / 18

Über den Referenten Über Hofmann EDV Linux, Layout und Satz Layout und Satz, Druckvorstufe Administration und Service Betreuung von Linux-Systemen (Debian) Programmierung und Automatisierung auf der Basis von PHP und Python Wireless Devices für den Innen- und Außeneinsatz Trainings für IT-Spezialisten Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 4 / 18

Informationen wiederfinden Suchen in Daten Werkzeug: Suchmaschine, Programm, Desktopsuche Darstellung der Suchergebnisse als Liste, Ringe oder Waben Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 5 / 18

Datenbasis Informationen wiederfinden Ziel: Dokumente und Daten wiederfinden und thematisch zuordnen zweckdienliche Verzeichnishierarchie anlegen sinnvolle Dateinamen vergeben Dokumente müssen durchsuchbar sein lesbar für uns und die Maschine (Programm) offene Dokumentation der Formate Text als Text im PDF einbinden, nicht als Bild ;-) Dokument klassifizieren Metainformationen setzen Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 6 / 18

Informationen wiederfinden Textseite ohne Metainformationen Sprüche Vegetarische Gerichte schmecken besonders gut, wenn dazu ein kleines Schnitzel gereicht wird. Sollten Sie einmal das Schnitzel nicht finden -- es liegt immer unter der Zitronenscheibe. Milchreis schmeckt hervorragend, wenn man es vor dem Verzehr durch ein saftiges Steak ersetzt. siehe: http://www.frag-mutti.de/ Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 7 / 18

Informationen wiederfinden Metainformationen bei Docbook Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 8 / 18

Informationen wiederfinden DVI-Dokumente DVI: geräteunabhängiges Dokumentenformat Suche in Xdvi und Okular unabhängig von Großund Kleinschreibung farbige Hervorhebung der Suchtreffer Xdvi: unterstützt Reguläre Ausdrücke auf der Kommandozeile: dvitype datei.dvi grep Muster Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 9 / 18

Informationen wiederfinden Metainformationen bei OpenOffice Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 10 / 18

Informationen wiederfinden Metainformationen im PDF L A TEX-Paket: hyperref Anzeigen der Metadaten mit UNIX-Kommando pdfinfo einfach: pdfinfo datei.pdf ausführlich: pdfinfo -box datei.pdf Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 11 / 18

Aufbau der Formate PostScript und PDF Das PostScript-Dokumentformat PostScript: stackbasierte Programmiersprache mit Variablendefinitionen, Prozeduren und Zuweisungen Prolog: Vorspann des Dokuments Script: Inhalt, Seitengröße, Grafik- und Textobjekte Trailer: Anhang Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 12 / 18

Aufbau der Formate PostScript und PDF Das PDF-Dokumentformat PDF: Dokumentenformat von Adobe Header: Vorspann des Dokuments mit Metainformationen Body: Inhalt, Grafik- und Textobjekte mit Positionsangaben (genannt Object Stream) Cross-reference Table: Inhaltsverzeichnis der einzelnen Objekte Trailer: Anhang Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 13 / 18

PostScript-Dateien durchsuchen PostScript-Dokumente Dokumentbetrachter: Ghostview, Kghostview, Evince und Okular bei unseren Tests funktionierte die Suchfunktion nicht auf der Kommandozeile: pstotext datei.ps grep Muster ps2ascii datei.ps grep Muster Nachteil: nur zuverlässig für Encoding ISO 8859-1 (Latin-1) Alternative über die Konvertierung nach PDF: ps2pdf datei.ps ; pdftotext datei.pdf grep Muster ps2pdf datei.ps ; pdfgrep datei.pdf Muster Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 14 / 18

PDF-Betrachter PDF-Dateien durchsuchen Dokumentbetrachter: Ghostview: keine Suche Epdfview, Evince, Okular, Xpdf Suche über Button, / (außer Xpdf) und Ctrl+F Apvlv, Mupdf, Zathura Suche analog zu vi(m)-tastenschema Suche im Dokument beginnt bereits während der Eingabe des Musters, Cursor springt zum nächsten Suchtreffer Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 15 / 18

PDF-Dateien durchsuchen Suche automatisieren Variante 1 pdftotext und grep mit einer Pipe in einer for-schleife: for datei in $(ls *.pdf); do pdftotext $datei - grep --color Muster ; done pdftotext kommt problemlos mit den Encodings ISO 8859-1, 8859-15 und UTF-8 zurecht explizite Auswahl des Encodings über die Option -enc Encoding Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 16 / 18

PDF-Dateien durchsuchen Suche automatisieren Variante 2... mit pdfgrep: pdfgrep Muster Dateiliste Option -i: unabhängig von Groß- und Kleinschreibung Option -n: Seite, auf der der Suchtreffer gefunden wurde Option -C Anzahl : Ausgabe max. Anzahl Zeichen Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 17 / 18

Vielen Dank Schlussworte Danke für Eure Aufmerksamkeit :-) Kontakt: Dipl.-Inf. Frank Hofmann Hofmann EDV Linux, Layout und Satz c/o büro 2.0 Weigandufer 45 12059 Berlin Email <frank.hofmann@efho.de> web www.efho.de Frank Hofmann () Postscript- und PDF-Dokumente durchsuchen 10. Juni 2012 18 / 18