{{commentsTotalLength}}
Beitrag von
Dieter Brors
heise Download Content Team

PDFs optimieren

Themen-Special: PDF-Dokumente nachträglich überarbeiten

Das Portable Document Format (PDF) bietet gegenüber proprietären Dokumentformaten wie DOC (Word) oder CDR (CorelDraw) den Vorteil, dass sich die Inhalte auf allen Rechnern layoutgetreu anzeigen und ausdrucken lassen. Die passenden Tools erstellen PDF-Dokumente im Nu und optimieren diese für verschiedene Einsatzzwecke – gratis. Dieser Artikel ergänzt das Themen-Special PDFs bearbeiten.

Artikel aus c't 4/08

Ob Diplomarbeit, Geschäftsbericht oder komplexe CAD-Zeichnung, als PDF gespeichert spielt es keinerlei Rolle, aus welcher Anwendung sie stammen. Zum Betrachten genügt ein Programm, das der PDF-Erfinder Adobe für alle gängigen Betriebssysteme kostenlos verteilt. Wer ein PDF per E-Mail versendet, auf der Website anbietet oder auf CD-ROM verteilt, muss sich daher keine Gedanken machen, ob der Empfänger den Inhalt lesen kann. Schlimmstenfalls muss dieser den Adobe Reader oder einen alternativen Betrachter nachinstallieren.

Mac-Benutzer benötigen keine speziellen Treiber oder Zusatzprogramme, da Mac OS X von Hause aus PDFs verarbeiten und anzeigen kann. Für Windows gibt es dafür Tools wie Sand am Meer. In der Regel arbeiten sie als virtuelle Drucker, sodass sie allen Windows-Anwendungen zur Verfügung stehen. Um ein PDF zu erzeugen, genügt es, das Textdokument, die Tabelle oder die CAD-Zeichnung einfach auf den speziellen "Drucker" zu schicken. OpenOffice ist von Haus aus und MS Office 2007 nach Installation eines Add-in mit PDF-Funktionen ausgestattet. Deren integrierte Konverter sind auf die Fähigkeiten der Anwendung abgestimmt und können etwa Inhaltsverzeichnisse mit Hyperlinks zu den zugehörigen Stellen im Dokument erzeugen.

Allerdings scheitert beispielsweise der Versuch, mit den Bordmitteln von OpenOffice Calc oder Excel 2007 Tabellen unterschiedlicher Dateien in ein einzelnes PDF zu überführen. Geeignete Konverter sammeln dagegen auf Wunsch alle Ausgaben, um sie zum Schluss in einem einzigen Dokument zu speichern. Daher lohnt es sich auch in PDF-fähigen Programmen, zu bestimmten Zwecken auf einen Alternativ-Konverter auszuweichen.

Dokumente wie Werbebroschüren, die in der Druckerei weiterverarbeitet werden, stellen allerdings weit höhere Ansprüche, bei denen die einfachen PDF-Erzeuger passen müssen. Sie erfordern beispielsweise Details zur Farbverarbeitung und diverse Angaben zur Seitengröße wie Beschnittzugabe oder Schnittgröße, die von der tatsächlichen Seitengröße abweichen können. Das leisten lediglich Profiwerkzeuge wie Adobe Acrobat, das in der dazu erforderlichen Professional-Variante fast 700 Euro kostet.

Gelegentlich gilt es, nachträglich Inhalte zu ändern, was aber nur wirklich zufriedenstellend funktioniert, wenn man zusätzlich zum PDF auch das Ursprungsdokument erhalten hat und die passende Anwendung zum Editieren besitzt. Kleinere Modifikationen lassen sich aber mit den hier vorgestellten Tools durchführen. So extrahieren sie beispielsweise Seiten oder setzen Teile mehrerer PDFs zu einem neuen Dokument zusammen, ohne die Struktur der Originaldatei anzutasten. Wer PDFs optimieren will, um sie beispielsweise mit höherer Kompression ins Web zu stellen, braucht sie nicht neu zu erstellen. Wenige Klicks verringern sie mitunter dramatisch und verkleinern die Ladezeiten erheblich – die Besucher Ihrer Website werden es schätzen. Über einen Trick lassen sich PDF-Inhalte sogar samt Layout so extrahieren, dass sie sich fast originalgetreu in Word und mit Einschränkungen auch in OpenOffice bearbeiten lassen.

Um möglichst einfach PDFs zu erstellen, ist man mit eDocPrintPro gut bedient. Der PDF-Erzeuger läuft als virtueller Drucker mit allen druckfähigen Programmen zusammen und hält sich weitgehend im Hintergrund. Nach der Druckausgabe über den eDocPrintPro-Treiber muss der Anwender per Dialog lediglich das Ausgabeverzeichnis wählen und einen Dateinamen eingeben – fertig istdas PDF. Optional lässt sich dies über die Druckeinstellungen automatisieren, was den Nutzer von jeglicher Interaktion befreit. Dann erzeugt das Tool den Dateinamen aus dem Originalnamen und hängt als Extension ".pdf" an. Außerdem lassen sich diverse Optionen setzen, um etwa Schriften einzubetten oder Text und Bilder zu komprimieren. Anstelle von PDFs kann der Konverter auch Bilddateien in den gängigen Formaten (TIFF, JPEG, PNG, BMP) erstellen. Da die Dateien dann aber riesig werden, eignet sich dies allenfalls als Notbehelf, um etwa einzelne PowerPoint-Folien in eine Webseite einzubetten. Da das Ändern der Optionen etwas lästig ist, bietet sich eDocPrintPro vor allem für jene an, die PDFs immer mit denselben Einstellungen erstellen wollen. Außerdem fehlen dem Konverter einige Funktionen, darunter vor allem Sicherheitsmechanismen, die PDFs mit einem Passwort schützen oder gegen das Entnehmen von Inhalten sperren.

Solche Schutzoptionen bietet der PDFCreator, der allerdings nicht ganz so komfortabel wie eDocPrintPro arbeitet. Er läuft ebenfalls als virtueller Drucker und erzeugt wie eDocPrintPro optional Bilddateien. Nach jedem Druckvorgang öffnet er einen Dialog mit den Einstellungen und sammelt per Mausklick alle Ausgaben in der Warteschlange, sodass der Anwender mehrere Dokumente oder Seiten auch aus unterschiedlichen Quellen zusammensetzen kann. Dazu muss er nicht einmal die gewünschte Reihenfolge einhalten, da sich die Aufträge in der Warteschlange beliebig umsortieren lassen. Diverse Optionen des PDFCreator bestimmen Auflösung oder Komprimierung von Text- und Bildobjekten oder bieten Schutzmaßnahmen, um PDFs durch ein Passwort zu sichern oder das Kopieren von Text und Bildern aus dem Adobe Reader heraus zu unterbinden.

Der Langzeitarchivierung elektronischer Dokumente dient der Standard PDF/A, der besondere Anforderungen vor allem hinsichtlich Bildschirm- und Druckausgabe stellt. Er beruht auf der älteren PDF-Spezifikation 1.4 und untersagt unter anderem Referenzen auf Daten, die nicht in der PDF-Datei enthalten sind, damit die Datei auch in ferner Zukunft zugänglich bleibt. So schreibt PDF/A vor, dass alle Schriften und Bilder eingebettet sein müssen. PDF/A Quick Master erzeugt als Druckertreiber solche PDFs und stellt sicher, dass sie diesem Standard entsprechen. Bei jedem Druckvorgang öffnet das Tool einen Assistenten, über den man das Dokument bei Bedarf mit Passwort schützen und einige Zusatzoptionen wie die Bildkompression einstellen kann.

Je nachdem, ob man PDFs archivieren oder ins Web stellen will, empfiehlt es sich, die Kompression anzupassen. So ist es sinnvoll, zur Archivierung die höchstmögliche Qualität für spätere Ausdrucke zu bewahren und die Dateien ohne Kompression abzulegen. Im Web kommt es eher darauf an, Informationen zu transportieren und die Besucher nicht durch minutenlange Downloads zu verstimmen. Durch höhere Kompression, insbesondere der Bilder, lässt sich die Dateigröße drastisch verringern. Dazu muss man die PDFs nicht einmal mit angepassten Einstellungen neu erzeugen. Im Free PDF Compressor braucht der Anwender nach Auswahl der Datei nur einen Kompressionsalgorithmus sowie die Kompressionsstärke auszuwählen, um nach kurzer Wartezeit eine optimierte Fassung unter neuem Namen zu speichern. Damit lassen sich zum Beispiel ältere PDF-Dateien der Version 1.3 um mehr als die Hälfte komprimieren.

Gelegentlich muss man aus PDFs einzelne Seiten oder Bereiche extrahieren, um etwa nur ein einzelnes Kapitel oder die Tabelle von einer bestimmten Seite anderweitig zu verwenden. Hat man einen als Drucker laufenden Konverter installiert, funktioniert das sogar aus dem PDF-Betrachter heraus, indem man die jeweiligen Seiten beim Drucken auf einen geeigneten Konverter wie PDFCreator umleitet, der mehrere Druckaufträge in ein PDF speichern kann. Auf diesem Weg lassen sich PDFs auch umsortieren oder mehrere zu einem Dokument zusammensetzen. Dazu muss man nur die Seiten oder Dateien in der gewünschten Reihenfolge in dieselbe PDF-Datei "drucken". Dieser Weg ist allerdings umständlich und birgt durch die zusätzliche Konvertierung die Gefahr von Qualitätsverlusten.

Daher empfiehlt es sich gelegentlich, auf spezielle Tools wie den PDF Helper zu setzen, die den Inhalt nicht antasten. Das kleine Programm verzichtet auf jeglichen Schnickschnack. Als Oberfläche gibt es nur einen Dialog, der die Verarbeitung startet oder die Anwendung beendet. Ein Klick auf "Help" blendet den Hinweis ein, man möge das zugehörige Readme-File lesen. Für die Ein- und Ausgabe sieht das Tool zwei Verzeichnisse auf der Festplatte vor. Die zu bearbeitenden PDFs legt man einfach in den Input-Ordner. Anschließend finden sich die erzeugten Dokumente im Output-Verzeichnis. Dabei bestimmt die Anzahl der Input-Dateien, was der kleine Helfer erledigen soll. So zerlegt er eine einzelne PDF-Datei in Einzelseiten und schweißt mehrere PDFs zu einem Dokument zusammen. Über eine Textdatei lässt sich der Ablauf mit einfachen Anweisungen steuern, um beispielsweise gezielt Seiten oder Bereiche zu extrahieren. So gibt etwa die Zeile "156-197,Kapitel5" an, dass die Seiten 156 bis 197 in der Datei Kapitel5.pdf gesichert werden sollen.

Neben den Inhalten speichern PDFs auch Metadaten mit Angaben wie Autor, Titel und Stichwörter. OpenOffice übernimmt sie aus den Dokumenteinstellungen oder man gibt sie beim Erzeugen an. Hat sich hier beispielsweise ein Tippfehler oder falscher Autorenname eingeschlichen, kann man das mit A-PDF Info Changer im Nu korrigieren. Dazu zeigt der Dialog den Inhalt aller editierbaren Eigenschaftsfelder an. Ein Klick auf "Save" speichert die Daten direkt im Original-PDF. Wer ganz sicher gehen will, sollte daher vorher den Originalzustand sichern.

Weitergehende Optionen bietet BeCYPDFMetaEdit, das unter anderem die Anzeigeoptionen für den PDF-Reader ändert, um den Inhalt beispielsweise als Doppelseite darzustellen oder im Vollbildmodus zu öffnen. Für diesen Präsentationsmodus lassen sich auch nachträglich Animationseffekte in Seitenübergängen definieren. Den Effekt, die Dauer und weitere Parameter kann man für jede Seite einzeln bestimmen. Außerdem bearbeitet das Programm Lesezeichen und fügt beispielsweise Kapitelüberschriften mit Links hinzu, sodass im PDF-Betrachter ein Mausklick genügt, um zur jeweiligen Stelle zu gelangen.

Alle Änderungen speichert das Programm als inkrementelles Update, was zwar die Datei vergrößert, aber auch eine Rückkehr zum Ursprungszustand erlaubt. Öffnet man die Datei mit der Option "vollständiges Neuschreiben", werden alle Inhalte endgültig durch die neuen ersetzt. In diesem Modus lassen sich PDFs auch durch ein Passwort schützen und verschlüsseln. Alle vorgenommenen Einstellungen kann man als Vorlagen speichern und später auf andere PDF-Dokumente anwenden. Im Batch-Modus lassen sich Modifikationen ohne Benutzer-Interaktion auf alle PDFs eines Verzeichnisses inklusive Unterordnern durchführen. Dazu sind als Parameter wahlweise die neuen Einstellungen oder der Name einer Vorlagendatei zu übergeben.

Um die Seiten eines PDFs zu nummerieren, bietet sich A-PDF Number Pro an. Neben Startseite und Seitenzahl für den Beginn lässt das Programm die Wahl, arabische oder römische Zahlen zu verwenden und diese in einer wählbaren Farbe unten links, rechts oder in der Mitte zu platzieren. Da sich die Position nicht frei bestimmen lässt, kann man eine eventuell vorhandene Nummerierung nicht einfach durch die neue überschreiben.

Wer PDF-Dokumente beispielsweise ins Internet stellt, will sie möglicherweise mit einem Hinweis wie "Entwurf" als Wasserzeichen auf jeder Seite kennzeichnen. Dazu müsste man normalerweise die Ursprungsdokumente ändern und die PDFs neu erzeugen. Der PDF Watermark Creator erspart diese Arbeit. Das kleine Programm öffnet die PDF-Datei, woraufhin man im Dialog den Text für Wasserzeichen, Schrift, Farbe und Position bestimmt. Die Modifikationen speichert das Tool in einer neuen Datei, sodass das Original unangetastet bleibt. Dieses "Stempeln" aller Seiten verläuft sehr schnell und dauert selbst bei Manuskripten mit mehreren hundert Seiten nur wenige Sekunden.

Ähnlich wie E-Mails sind auch PDFs in der Lage, zusätzliche Dateien zu transportieren. Das ist beispielsweise praktisch, um zu Archivierungszwecken das Ursprungsdokument aus Word, OpenOffice oder einer anderen Anwendung mit dem PDF zu verschweißen. Damit bleiben alle Inhalte stets auch in editierbarer Form zusammen, sodass man später nicht erst das Original suchen muss, um es zu bearbeiten. Solche Anhänge lassen sich aus dem Adobe Reader heraus separat auf Festplatte speichern oder per Doppelklick in der zugehörigen Anwendung öffnen. PDF Bundle hängt eine Datei an ein PDF-Dokument an. Da das Programm nur die Auswahl eines einzelnen Attachments zulässt, wiederholt man dies einfach für weitere Dateien.

Falls das Originaldokument nicht mehr existiert und man trotzdem größere Änderungen vornehmen muss, lässt sich dies nicht einmal in Adobe Acrobat vollständig durchführen, da Adobe das Editieren von PDFs nicht vorgesehen hat. Ein Umweg bringt den Inhalt trotzdem in eine editierfähige Form. Zwar lassen sich Text und Bilder aus dem Reader über die Zwischenablage beispielsweise in Word kopieren, doch geht dabei das Layout zum größten Teil verloren. Der Trick besteht darin, das PDF mit geeigneter OCR-Software einzulesen. Dazu findet sich mit dem Abbyy FineReader eine geeignete Anwendung als Vollversion auf der Heft-DVD der bereits erwähnten c't 4/08, die neben Bilddateien auch PDF-Dokumente direkt verarbeitet. Dabei bleiben Struktur wie mehrspaltiger Satz und Inhalte inklusive Bildern und deren Position weitgehend erhalten. Übers Dateimenü sendet das OCR-Programm die eingelesenen Seiten an Word, Excel oder StarOffice beziehungsweise OpenOffice und öffnet die entsprechende Anwendung automatisch mit dem Inhalt. Dies funktioniert sehr gut mit Word und Excel, doch in StarOffice und OpenOffice bleibt nur die Textformatierung, aber nicht das Seitenlayout erhalten.

Der Adobe Acrobat Reader zaubert PDFs auf den Bildschirm und druckt sie bei Bedarf aus. Er läuft auf allen wichtigen Betriebssystemen und ist mittlerweile auch für Linux bei Version 8.1 angelangt. Sie läuft deutlich schneller als der 7er-Vorgänger, stört aber beim Aufbau mehrseitiger Dokumente mitunter durch Wartezeiten, um den Inhalt vorzubereiten. Ein in die Symbolleiste integriertes Suchfeld durchforstet Dokumente und erspart damit das Öffnen des Suchdialogs. Zuschaltbare Miniaturansichten der Seiten erleichtern es, bestimmte Stellen schnell wiederzufinden, solange sich das Layout etwa durch die Position eingebetteter Grafiken deutlich unterscheidet.

Als schnellere Alternative bietet sich neben dem Foxit Reader der PDF Action Reader an, der die wichtigsten Werkzeuge zum Betrachten und Drucken mitbringt, aber beispielsweise keine Präsentationen im Vollbildmodus starten kann. Die Suchfunktion markiert auf Wunsch alle Fundstellen, was sich jedoch nur im sichtbaren Bereich praktizieren lässt, da die Markierung aufgehoben wird, sobald man ins Dokument klickt oder weiterblättert. Zudem unterstützt der Reader nicht die vollständige PDF-Spezifikation und kann etwa keine verschlüsselten Dokumente öffnen. Deshalb sollten Sie besser nicht auf den Adobe Reader als Ausweichoption verzichten. Seine Stärken zeigt der Action Reader vor allem im Umgang mit Formularen, denn die kann er auch in ausgefüllter Form speichern.

( )

Wie bewertest Du die Qualität des Beitrags?

Pflichtlektüre! ({{threeCount}})
Gut zu wissen ({{twoCount}})
Geht gar nicht! ({{oneCount}})
Vielen Dank für Deine Bewertung.
Deine Bewertung wurde gelöscht.

Kommentare

{{commentsTotalLength}} KommentarKommentare

Weitere Kommentare laden...

Das könnte dich auch interessieren