Die drei Buchstaben stehen für Portable Document Format und bezeichnen ein Format für Dokumente aus Text und Bildern, das als offener Standard angenommen wurde. Für eine in allen Aspekten korrekte Verwendung dieses Formats sollte man sich seine Eigenschaften, Vorteile und Herausforderungen klar machen.
Inhalt
Das Ziel der Entwicklung des Dateiformats
Zuerst erschien das Format bei der Firma Adobe Systems im Jahr 1993, seit 2008 wird es als offener Standard von der PDF Association betreut. Eine Darstellung von Text, Bildern und Grafik sollte möglich sein und auf allen Ausgabegeräten und Betriebssystemen korrekt auftauchen. Diese Eigenschaft bezeichnet man als portable. Das Ziel der Portabilität gelingt auch mit diesem Dateiformat. Der Preis für diese universelle Verwendbarkeit besteht allerdings darin, dass eine direkte Bearbeitung einer Datei nach ihrer Erstellung schwierig ist.
Verwendung und Möglichkeiten
Die technische Realisierung des Dateiformats bringt es mit sich, dass die Grundlage für ein Dokument mit einem dafür geeigneten Programm erstellt wird. Die eigentliche pdf-Datei wird dann aus dieser Grundlage erzeugt. Im Text
kann man suchen, auch, wenn dieser Text verzerrt und grafisch aufwendig gestaltet angezeigt ist. Das leuchtet auch ein, wenn man beachtet, dass der Text und die Verzerrungen separat gespeichert werden. Zu einer pdf-Datei gehört auch eine miniaturisierte Vorschau, die als Icon auf dem Bildschirm angezeigt wird und mit der sich zumindest eine grobe Idee des Inhalts bereits erkennen lässt. Angezeigt auf einem Bildschirm bietet eine pdf-Datei auch Möglichkeiten, die in ausgedruckter Form nicht nutzbar sind.
Das Inhaltsverzeichnis oder andere beliebige Teile können klickbar sein. Mit eine Klick kann man zu den referenzierten Teilen des Dokuments springen. Auch Links zu externen URLs kann eine Datei enthalten. Für ihre Nutzung muss das Gerät natürlich über eine aktive Internetverbindung verfügen. Eine pdf-Datei kann ein auszufüllendes Formular enthalten. Statt es auszudrucken, auszufüllen und wieder einzuscannen bietet das Format auch die Möglichkeit, es auf dem Bildschirm direkt auszufüllen. Es sind dann nicht nur die anderen Schritte überflüssig, die Eintragungen sind in Schriftsatz statt in Handschrift gespeichert. Dieselbe Methode steht für das Hinzufügen von Kommentaren zur Verfügung.
Technische Grundlagen
Das Dateiformat hat starke Ähnlichkeiten mit Postscript und ist also auch eine vektorbasierte Seitenbeschreibungssprache. Ein Dokument kann Bilder als Bitmap enthalten, die Struktur liegt allerdings im Format dieser Beschreibungssprache vor. Nummerierte Objekte enthalten die Details von Text, Vektorgrafik, Schrifttypen und Farben. Ein Objekt kann auch ein Bild als Bitmap enthalten. Wenn der Autor das wünscht, lässt sich auch ein neues Font im Dokument festlegen. Als Standard stehen auf jeder Zielplattform 14 Schrifttypen zur Auswahl. Eine pdf-Datei kann größer oder kleiner als die Ausgangsdatei sein, aus der sie gebildet wurde. Dieser Dateiumfang hängt von der enthaltenen Grafik, aber auch von der Effizienz des Erstellungsprogramms ab. Lesen Sie hier alles zum Thema Bitmap.
Möglichkeiten zur Umwandlung und Übertragung
Die Ausgangsformate HTML, XML und TEX lassen sich alle in das pdf-Format umwandeln. Der Autor einer pdf-Datei kann sie verschlüsseln und für das Öffnen ein Passwort festlegen. Genauso kann der Autor das Ausdrucken oder das Kopieren von Teilen aus einer pdf-Datei blockieren. Es ist aber natürlich weiter möglich, einen Screenshot der Datei anzufertigen und diesen weiter zu verarbeiten. Manche quelloffenen Programme zur Verarbeitung von pdf-Dateien erkennen solche Blockierungen nicht und eigenen sich damit zum Umgehen solcher Sperren. Pdf-Dateien können sehr umfangreich sein. Ein Herunterladen solcher Dateien nimmt also entsprechend Zeit in Anspruch. Dafür kann man ein Dokument serialisieren. Ein pdf-Reader zeigt den Anfang einer solchen Datei an, bevor das ganze Dokument heruntergeladen ist. Für pdf-Dateien steht eine Kompression zur Verfügung. Diese ist besonders effektiv, wenn ein Dokument aus vielen kleinen Objekten besteht.
Seitengeometrie
Diese Angaben sind besonders für den Druck wichtig. Die Mediabox definiert die Größe des Ausgabemediums, also beispielsweise des Blatts Papier im Drucker. Die Größe der Mediabox muss für jedes pdf-Dokument angegeben werden. Innere Boxen können den Seiteninhalt begrenzen und Abstände wie den Anschnitt festlegen. Dieser legt fest, wie weit der Inhalt des Dokuments vom Seitenrand entfernt sein muss.
Vorteile des Formats
Das Dateiformat bietet große Flexibilität durch die Seitenbeschreibung, die Grafik, Text und Bilder festlegen kann. Durch seine überzeugende technische Umsetzung hat sich das Dateiformat als Standard durchgesetzt. Diese Verbreitung wiederum stellt einen enormen Vorteil dar, denn der Autor einer pdf-Datei kann sich darauf verlassen, dass seine Datei überall und von jedem Empfänger weiterverarbeitet werden kann.
Was ist bei der Verwendung von pdf-Dateien zu beachten?
Aus der universell korrekten Anzeige einer Datei ergibt sich, dass sie nicht einfach direkt zu bearbeiten ist. Jede
Bearbeitung darf schließlich diese universelle Verwendbarkeit nicht gefährden. Das ist ein wesentlicher Unterschied zu einem herkömmlichen Textverarbeitungsprogramm. Ein instruktives Beispiel, dessen praktische Folgen bei Gelegenheit auch sorgfältig zu beachten sind, betrifft das Schwärzen von Dokumenten. Die naive Annahme ist, dass ein schwarzer Balken über Text diesen unleserlich macht. In einer pdf-Datei ist der Balken aber nur ein zusätzliches Objekt, das in der Datei abgespeichert wird. Der geschwärzte Text ist nach wie vor in der Datei enthalten und kann mit etwas Aufwand ohne Weiteres ausgelesen werden. Dasselbe gilt für Metadaten, die nur nach einem eigenen Aufruf lesbar sind. Fehler beim Schwärzen von Dokumenten wurden schon von der UNO und verschiedenen Regierungen gemacht. Für die korrekte Verwendung von pdf-Dateien ist also ein Verständnis der technischen Grundlagen des Dateiformats wichtig. Eine Missachtung dieser Voraussetzungen kann die unabsichtliche Veröffentlichung von streng geheimen Informationen zur Folge haben.
Claudia Rothenhorst ist Medien- und Reise-Redakteurin bei der Web-Redaktion. In ihrer Freizeit reist sie gerne und schreibt darüber unter anderem auf Reisemagazin.biz.
Weitere Artikel von Ihr erscheinen u.a. im Blog der Webagentur Awantego.