Bewertung: 5 / 5

 
images/Dokumentenoptimierung/PDF/Thorsten_H_Willert_-_Dokumentenoptimierung__PDF_Titel_.svg

PDFs werden seit vielen Jahren verwendet

dennoch sind die Dateien oft nicht optimal gespeichert.

Die häufigsten Auffälligkeiten sind:
  • extrem große Dateien – obwohl kaum Inhalt vorhanden ist
  • verpixelte Grafiken – die kaum erkennbar sind
  • eingefügte Internet- oder E-Mail-Links, welche nicht anklickbar sind
  • seltsame Dokumententitel wie: Word Dokument 0815.docx
  • Formulare, die man nicht ausfüllen kann
  • dass fast nie ein Passwort-Schutz vorhanden ist, braucht kaum noch erwähnt zu werden
Das können Sie vermeiden …

Die meisten Screenshots sind von LibreOffice. In anderer Software sehen die Einstellungen ähnlich aus.

Dateigröße

Die Dateigröße einer PDF wird durch mehrere Faktoren bestimmt.

Die wichtigsten sind:
  • Anzahl der Seiten
  • Anzahl der verwendeten Schriftarten
  • Anzahl und Art der Grafiken (Vektor oder Raster)
  • Menge des Textes
  • Auflösung des Dokuments / Grafiken (dpi)
  • Eingebettete Dateien
  • Scripte

Das Verhältnis, wie die einzelnen Faktoren die Größe beeinflussen, sieht oft wie folgt aus:

Thorsten H Willert   Dokumentenoptimierung  PDF Speicherprfung
Speicherprüfung mit Adobe Acrobat

Anzahl der Seiten

Hier lässt sich wenig beeinflussen. Wenn ein Buch ein paar hundert Seiten hat, dann ist es eben so.

Anzahl der verwendeten Schriftarten

Für eine korrekte Darstellung beim Empfänger sollten alle Schriftarten vollständig eingebettet werden.

Halten Sie sich an die Typographen Regel: Weniger ist mehr.
Arbeiten Sie mit maximal zwei Schriftarten. Mehr, geht zulasten der Lesbarkeit.
Achten Sie auch auf die Schriftart. Serifenlose Schriften, wie Arial, sind in langen Texten nicht angenehm zu lesen und strengen den Leser zu sehr an.
In Büchern sollte das absolut vermieden werden.

Kommt es nur auf den Text an und ist die Schriftart egal, dann betten Sie einfach keine Schrift ein, oder? Einfach mal ausprobieren.

Haben Sie es ausprobiert – ja?

Auf dem Rechner, auf der die Datei erstellt wurde, funktioniert das Weglassen der Schriften ohne Probleme und wenn Sie es auf einem Rechner öffnen, der diese Schriftarten nicht installiert hat, passiert Folgendes:
Entweder es wird eine Ersatzschrift gefunden, oder das Dokument wird unlesbar.
Das kann sich bei jedem Empfänger unterschiedlich auswirken.

PDF ohne eingebettete Schriften auf unterschiedlichen Systemen
Windows
auf dem die PDF erstellt wurde
Acrobat Reader
Windows
ohne zusätzlich installierte Schriftarten
Adobe Acrobat Pro
Linux
ohne zusätzlich installierte Schriftarten
Okular
Thorsten H Willert   Dokumentenoptimierung PDF Schrift Eing Original


Vollständig lesbar
Thorsten H Willert   Dokumentenoptimierung PDF Schrift Eing Frisch


Teilweise lesbar
Thorsten H Willert   Dokumentenoptimierung PDF Schrift Linux Frisch


Unlesbar!
Testen Sie erstellte PDFs auch auf fremden (Betriebs)-Systemen.
Eine falsche Einstellung beim Exportieren und das Dokument ist beim Empfänger evtl. nicht mehr zu gebrauchen!
Wenn Sie kein anderes Testsystem (Rechner) zur Verfügung haben, installieren Sie einen virtuellen Rechner, wie z. B. mit VirtualBox.

Anzahl und Art der Grafiken

Grafiken beeinflussen die Größe einer PDF-Datei am meisten.

Hier lässt sich viel Platz sparen, indem Sie Logos, Strichzeichnungen, Diagramme und andere einfachere Grafiken als Vektorgrafik einsetzen.
Bestimmte Bilder in Graustufen umwandeln (z. B. Screenshots von Texten oder Strichzeichnungen).
Alle Bilder erst einmal auf gar keinen Fall als JPEG einsetzen, außer Fotos in höchster Qualität, damit die Bilder beim Export nicht nochmals komprimiert und damit qualitativ schlechter werden.

Einige Office-Pakete bieten die Möglichkeit, die Bilder nach dem Einfügen zu komprimieren

Nutzen Sie diese Möglichkeit, um bei verschiedenen Bildern hier unterschiedliche Qualitätsstufen einzustellen, oder um zu große Bilder anzupassen.

Vermeiden Sie es, Bilder in Textverarbeitungen zuzuschneiden. Damit werden die Bilder meistens nicht kleiner, sondern nur Teile davon ausgeblendet. D. h. die Dokumentengröße ändert sich dadurch nicht.

PDF-Optimierung mit Online-Diensten

Möchten Sie es einfacher haben und Ihre Dokumente sind keine Geheimnisse?

Es gibt einige Online-Dienste, bei denen man PDFs hochladen und die optimierte Version wieder herunterladen kann. Sie werden erstaunt sein, wie Sie damit ihre Dateien klein bekommen.

Komprimierung von verschiedenen PDFs, z. B. mit dem Online-Dienst PDF Compressor:

PDF_Compressor
Verschiedene PDFs mit PDF Compressor optimiert.

Qualitätsunterschiede sind an den Dateien danach so gut wie nicht vorhanden.

Die Datei mit 92 % Ersparnis war zuvor ca. 15 MB groß; d. h. die Dateigröße war danach nur noch ca. 1,2 MB.
Das wären bei 1 Million Downloads ca. 13,8 TB an Daten, die umsonst übertragen werden!

Da dies kein Einzelfall ist, ist die umsonst übertragene Datenmenge weltweit um ein Vielfaches größer.

Auflösung

Für das Lesen am Bildschirm sind 200 dpi akzeptabel.
Bei 150 dpi werden die Grafiken meistens undeutlich, was gerade bei JPEG-Komprimierung sehr hervorsticht.

Soll das Ganze gedruckt werden, sollten es mindestens 300 dpi sein.

Thorsten H Willert   PDF LibreOffice Allgemein

Links

Links im Dokument

Wenn Sie Links oder E-Mail-Adressen im Dokument angeben, dann bitte so, dass diese auch anklickbar sind.
Niemand möchte Links aus einem Dokument herauskopieren, oder gar abtippen, nur weil der Text aus einer Grafik besteht!
Für Ausdrucke diese nochmal am Ende als Liste angeben. Blanke Links sehen mitten im Text sehr unschön aus und hindern den Lesefluss ungemein. Zudem ist nicht sicher, ob diese in einigen Jahren, oder auch nur Tagen, noch aktuell sind.

Einige Programme bieten die Möglichkeit, Links automatisch zu erkennen und zu erzeugen

Links von Web-Seiten auf eine PDF-Datei

Neben der Möglichkeit direkt auf eine PDF-Datei zu verlinken, bestehen auch noch die Möglichkeiten auf bestimmte Inhalte in einer PDF-Datei zu verlinken.
  1. Benanntes Ziel / Sprungmarke:
    Genau wie in Web-Seiten oder Ziele innerhalb eines PDFs lassen sich diese mit externen Links ansprechen:
    <a href="https://www.example.com/example.pdf#marke">

    Den Link auf Ziele in vorhandenen PDF-Dateien herauszufinden, ist mit Adobe-Programmen oft umständlich bis unmöglich (Reader).
    Am einfachsten ist es, die PDF-Datei mit FireFox zu öffnen. Dort kann man die Links im Inhaltsverzeichnis oder an den Zielen über das Kontextmenü kopieren.

  2. Bestimmte Seite:
    Auch Seiten lassen sich gezielt aufrufen, z. B. die Seite 100:
    <a href="https://www.example.com/example.pdf#page=100">

Dokumententitel / Dokumenten-Information

Der Titel ihrer PDFs soll sicher nicht in der Art Word Dokument Vorlage xyz.docx lauten, sondern der Titel ihres Dokuments sein.
Den Titel bitte passend in die Dokumenten-Informationen eintragen; inklusive Autor, Thema, Stichworte, Auflage, Version usw. und beim Speichern der PDF-Datei auch angeben, dass der Titel angezeigt wird.

Thorsten H Willert   PDF LibreOffice Benutzeroberflaeche

Formulare

  • Gestalten Sie PDF-Dokumente zum Ausfüllen als Formular!
  • Nicht jeder Anwender nutzt die Funktionen zum Ausfüllen / Beschriften von PDFs.
  • Wenn sie Formulare erstellen, dann so, dass man diese auch ausgefüllt speichern kann.

Häufig findet man folgende Arbeitsschritte im Umgang mit PDFs zum Ausfüllen:
  1. Dokument wird zum Ausfüllen (kein Formular) per E-Mail an den Empfänger gesandt oder von diesem heruntergeladen.
  2. Empfänger druckt das Dokument aus
  3. Empfänger füllt das Ganze handschriftlich aus
  4. entweder: Empfänger scannt (fotografiert) das Dokument wieder ein und der Absender erhält es per E-Mail
  5. oder: Empfänger verpackt es in einen Umschlag und es kommt auf Papier zurück zum Absender.
    Das kann auch passieren, weil E-Mail, für manche Personen, so viel komplizierter ist als WhatsApp …
  6. Absender darf dann die Daten wieder aus der Grafik abtippen, weil Handschrift und automatische Texterkennung meistens nicht optimal kompatibel sind

Ersparen Sie sich, Ihren Mitarbeitern, Kunden und Anwendern diesen Ablauf!
Erstellen Sie richtige Formulare, deren Daten Sie auch automatisch weiterverarbeiten können.

(siehe auch: PDF-Formular-Daten importieren und exportieren mit dem Adobe Acrobat Reader)

Orientieren Sie sich bei Formularen immer an Maximalwerten, wie z. B. dem längsten Ortsnamen Deutschlands: Hellschen-Heringsand-Unterschaar (32 Buchstaben).
Testen Sie, ob Sie das auch handschriftlich eintragen können! Bei vielen Formularen, gerade von Ämtern, ist dies unmöglich.
Sollten Sie selbst in die Verlegenheit geraten und ein ausgefülltes PDF-Formular nicht speichern können, dann ist die Lösung einfach:
Speichern Sie es als PDF über einen PDF-Drucker, oder in Windows notfalls als XPS.
Wenn Sie die Daten aus dem Formular weiterverarbeiten möchten, gestalten Sie es so, dass die Daten z. B. als FDF oder XFDF (XML) Datensätze exportiert werden können.

Was häufig fehlt:
Wenn Sie erwarten, dass ein Formular auf dem Postweg zurückgesandt wird, dann gestalten Sie auch das Formular so, dass die Rücksendung (erste Seite), mit Ihnen als Empfänger, in einen Fensterumschlag passt.
Dadurch ersparen Sie Ihrem Kunden, dass er Ihre Anschrift nochmals auf den Briefumschlag schreiben muss.

Passwort Schutz


Signierung und Passwortschutz sind bei PDFs nur bedingt brauchbar. Damit kann ein Auslesen oder Verändern des Inhalts nicht verhindert werden [3].
PDF-Dokumente können gegen Lesen, Drucken usw. geschützt werden, darum nutzen sie es auch.
Am sinnvollsten ist hier meistens der Schutz gegen die Entnahme von Inhalten.

Bevor in LibreOffice die Optionen anwählbar sind, müssen sie ein Kennwort eingeben:

Thorsten H Willert   PDF LibreOffice Kennwort

Thorsten H Willert   PDF LibreOffice Sicherheit

Der Passwortschutz funktioniert nicht bei PDF/A Dokumenten, die für die Archivierung gedacht sind.
Wenn Sie PDFs zum Download anbieten, achten Sie darauf, dass die Meta-Informationen (Titel, Verfasser) unverschlüsselt blieben. Suchmaschinen können diese Informationen sonst nicht auslesen.
Dies lässt sich nur in den wenigsten Programmen getrennt einstellen (Adobe Acrobat).

Eingebettete Dateien

Diese sind in erster Linie für die Archivierung gedacht (PDF/A). Möchte man die PDFs nicht zum Bearbeiten weitergeben, dann betten sie nicht die Originaldatei ein.
Die Originaldatei kann um ein Vielfaches größer sein, als die eigentliche PDF-Datei.

PDF Export aus verschiedenen Office-Pakten

Beim PDF-Export aus verschiedenen Office-Paketen heraus fällt auf, dass die Ergebnisse sehr unterschiedlich ausfallen, bei allem, was über reinen Text hinausgeht.

Nicht jedes Programm kann alles gleich gut und es gibt extreme Unterschiede, was die Export-Optionen betrifft.

Ergebnis nach dem PDF-Export
Die Tabelle wird laufend erweitert … (aktueller Stand: 06.06.2022)
Programm Schriften Schriften einbetten
vollständig / teilweise
Transparente Schatten Transparenz PNG SVG EMF / WMF Export als JPEG 2000 Formen
Export als Vektor
Farbverlauf
Export als Vektor
LibreOffice 7.3 / -
keine weichen Schatten möglich
wird zu Rastergrafik
Softmaker Office 2021 /
wird zu Rastergrafik

wird zu Rastergrafik

Druck über PDF-XChange bleibt skalierbar.
wird zu Rastergrafik wird zu Rastergrafik
Microsoft Office 365
(ab 2016, Version 1611 build 7571.2072)
ABBY Finereader
(Drucker PDF-XChange)
/ Programmabhängig

Vergleich der Export-Einstellungen (Bild-Kompression)
Thorsten H Willert   PDF LibreOffice Allgemein
Thorsten H Willert   Dokumentenoptimierung  PDF Textmaker 2021 Export
Thorsten H Willert   Dokumentenoptimierung  PDF Word Export

Microsoft Office bietet nur grundlegende Einstellmöglichkeiten, die dazu nicht alle in einem Dialog gesammelt sind.
Wenn man als Ergebnis hochwertige PDF-Dateien haben möchte, ist Microsoft Office nicht zu empfehlen.
Thorsten H Willert   Dokumentenoptimierung PDF Export PDF XChange

Optimierung mit Ghostscript

Ghostscript ist ein freier Interpreter der Seitenbeschreibungssprache PostScript und des Portable Document Format. aus Wikipedia

Ghostscript ist für verschiedene Betriebssysteme erhältlich und Basis für viele Programme, die PDFs erzeugen oder verarbeiten.

PDF-Optimierung mit Ghostscript [5]

pdfcompress ()
{
   gs -q -dNOPAUSE -dBATCH -dSAFER \
   -dFastWebView \
   -sDEVICE=pdfwrite \
   -dCompatibilityLevel=2.0 \
   -dPDFSETTINGS=/screen \
   -dPreserveMarkedContent=true \
   -dEmbedAllFonts=true \
   -dSubsetFonts=true \
   -dConvertCMYKImagesToRGB=true \
   -dJPEGQ=70 \
   -dDownsampleColorImages=true \
   -dColorImageDownsampleType=/Bicubic \
   -dColorImageResolution=200 \
   -dDownsampleGrayImages=true \
   -dGrayImageDownsampleType=/Bicubic \
   -dGrayImageResolution=200 \
   -dDownsampleMonoImages=true \
   -dMonoImageDownsampleType=/Subsample \
   -dMonoImageResolution=400 \
   -sOutputFile=${1%.*}.compressed.pdf $1;
   
	exiftool -tagsFromFile $1 ${1%.*}.compressed.pdf;
  	exiftool -g ${1%.*}.compressed.pdf;
}
                  
                  
Diese Anweisung z. B. in die .basrc einfügen, somit können Sie jederzeit in der Konsole eine PDF optimieren mit dem Aufruf
pdfcompress MeineZuGrossePDF.pdf.

@echo off
:start
echo.
echo %1

FOR %%A IN (%1) DO set file=%%~fA

	"%ProgramFiles%\gs\gs10.00.0\bin\gswin64c.exe"  ^
		-q -dNOPAUSE -dBATCH -dSAFER ^
	   -dFastWebView ^
	   -sDEVICE=pdfwrite ^
	   -dCompatibilityLevel=2.0 ^
	   -dPDFSETTINGS=/screen ^
	   -dPreserveMarkedContent=true ^
	   -dEmbedAllFonts=true ^
	   -dSubsetFonts=true ^
	   -dConvertCMYKImagesToRGB=true ^
	   -dJPEGQ=70 ^
	   -dDownsampleColorImages=true ^
	   -dColorImageDownsampleType=/Bicubic ^
	   -dColorImageResolution=200 ^
	   -dDownsampleGrayImages=true ^
	   -dGrayImageDownsampleType=/Bicubic ^
	   -dGrayImageResolution=200 ^
	   -dDownsampleMonoImages=true ^
	   -dMonoImageDownsampleType=/Subsample ^
	   -dMonoImageResolution=400 ^
	   -sOutputFile=%1.compressed.pdf "%file%"
	echo.
	shift
if NOT x%1==x goto start
pause
                  
Das Ganze können Sie als Batch-Datei abspeichern.
Diese funktioniert per Drag-and-Drop, also einfach die zu optimierende PDF auf das Icon der Batch-Datei ziehen.
Ghostscript übernimmt leider keine Metadaten.

Hier hilft z. B. das ExifTool weiter, mit dem Aufruf: exiftool -tagsFromFile Input.pdf Output.pdf
Der Befehl übernimmt alle Metadaten aus der Input.pdf und schreibt sie in die Output.pdf.

Weitere PDF-Optimierung

Wer im Besitz von Adobe Acrobat Professional, einem Nachfolger davon im Abo oder einer ähnlichen Software, ist, der kann PDF-Dateien noch weiter optimieren.

(Meine) Vorgehensweise:
  1. Dokument wie oben beschrieben vorbereiten.
  2. Wenn es für den Bildschirm ist: Bilder, die bei 200 dpi noch gut aussehen, im Dokument die Auflösung des Bildes auf 200 dpi reduzieren.
  3. Das Dokument als unkomprimiertes PDF speichern. Nicht erschrecken - das Ergebnis kann richtig groß werden.
  4. Diese PDF in Adobe Acrobat Pro öffnen und die "PDF Optimierung" (Menü: Erweitert) öffnen.

Die Einstellungen für Transparenz nicht markieren und die Schriften kann man normalerweise auch lassen, wie es vorgeschlagen ist.

Wichtig sind die folgenden Einstellungen.

Adobe Acrobat: PDF-Optimierung
Der wohl wichtigste Punkt. Mit dieser Einstellung wird nun jedes Bild, das mehr 200 dpi hat, mit JPEG 2000 komprimiert, was wesentlich effektiver als JPEG ist.
Thorsten H Willert   Dokmentenoptimierung PDF AdobeAcrobatPro Bilder Komp

JBIG2
Bei Schwarzweißbildern sollte (laut BSI), für rechtssichere Dokumente, auf die JBIG2-Komprimierung verzichtet werden  [1]  [2].

Das Problem liegt hier allerdings nicht im Verfahren, sondern in einer fehlerhaften Implementierung, die in XEROX-Kopierern, über viele Jahre hinweg, zu verfälschten Scans und Kopien führte [4].
Diese Seite sollte beachtet werden, wenn die PDF-Formulare enthält.
Thorsten H Willert   Dokmentenoptimierung PDF AdobeAcrobatPro Objekte
Hier aufpassen, sonst werden sämtliche Links und Benutzerdaten wieder gelöscht!
Einfach an den gezeigten Einstellungen orientieren.
Thorsten H Willert   Dokmentenoptimierung PDF AdobeAcrobatPro Benutzer
Soll die Datei aus dem Internet geladen werden, unbedingt den letzten Punkt "PDF für schnelle Webanzeige optimieren" aktivieren. Damit wird die erste Seite schon angezeigt, auch wenn die Datei noch nicht vollständig heruntergeladen ist.
Thorsten H Willert   Dokmentenoptimierung PDF AdobeAcrobatPro Bereinigen

Checklisten

Allgemein

  • Der Dateiname ist aussagekräftig. z. B. Firma_Artikel_Rechnung_Datum.pdf, Autor_Buchreihe_Band_Auflage.pdf)
  • Maximal zwei bis drei Schriftarten (bei Texten).
  • Alle Schriftarten sind vollständig eingebettet.
  • Logos, Strichzeichnungen, Diagramme und andere einfachere Grafiken als Vektorgrafik.
  • Links / E-Mail sind alle anklickbar und öffnen das entsprechende Programm (Browser, E-Mail).
  • Dokumenten Information / Titel vorhanden und wird in einem PDF-Viewer auch angezeigt.
  • Passwortschutz / Zertifikat.
  • Dateien sind eingebettet, nur wenn dies unbedingt nötig ist (Archivierung / PDF/A).
  • Auflösung der PDFs beim Speichern angepasst (min. 150 dpi, wenn Grafiken enthalten).
  • Komprimierung der Grafiken beim Speichern angepasst.
  • Bei Schwarzweißbildern ist keine JBIG2-Kompression verwendet.
  • Ergebnis auf verschiedenen System getestet? Die PDF muss überall gleich aussehen!

Verwendung als Formular

  • Formulare lassen sich ausfüllen.
  • Alle Formularfelder sind für Maximalwerte ausgelegt (z. B. längster Ortsname Deutschlands).
  • Alle Formularfelder sind groß genug, um diese problemlos mit der Hand auszufüllen.
  • Ausgefüllte Formulare lassen sich mit den Informationen abspeichern.
  • Formular-Daten lassen sich als z. B. als FDF oder XFDF speichern und weiterverarbeiten.

Verwendung als Download

  • Suchmaschinenoptimierung (SEO): Meta-Informationen sind angegeben (Titel, Verfasser, Stichworte).
  • Suchmaschinenoptimierung (SEO): Text nicht als Grafik.
  • Suchmaschinenoptimierung (SEO): Hat die PDF den gleichen Inhalt wie die Webseite (Duplicate Content)? Dies entsprechend berücksichtigen (Sitemap, canonical Tags, .htaccess).
  • Die PDF ist für schnelle Webanzeige optimiert.
  • Die Meta-Informationen sind auch mit Passwortschutz auslesbar.
  • Die Dateigröße ist möglichst gering.

Zusammenfassung

Mit relativ wenig Aufwand lassen sich PDF-Dokumente erstellen, welche:
  • kompakt sind
  • zufriedene Benutzer hinterlassen
  • Bandbreite und Speicherplatz und somit auch Energie sparen

Mehr zum Thema

Software

Weiterführende Informationen

Begriffserklärungen

Downloads

pdf.png Dokumentenoptimierung Beispielvorlage 2.1  Beliebt    
Ein PDF-Beispiel mit verschiedenen Vektorgrafiken, Schriftarten, Tabellen und simulierter Bleistift / Kugelschreiber Handschrift.    Download
 07.02.2023  461.89 KB      624

pdf.png Dokumentenoptimierung - PDF Schriften nicht eingebetttet       
PDF mit nicht eingebetteten Schriftarten.    Download
 18.07.2022  41.96 KB      478

Updates

  • 22.05.2023: Rechtschreibfehler und Grammatik korrigiert.
  • 18.02.2023: Abschnitt Optimierung mit Ghostscript eingefügt und verschiedene Korrekturen.