Menü

Google durchsucht PDF

vorlesen Drucken Kommentare lesen 83 Beiträge

Als erste große Suchmaschine durchsucht Google jetzt auch PDF-Dateien. Noch sind nicht alle Computer des Google-Rechnerverbunds mit den PDF-Daten aktualisiert worden. So ist es derzeit noch ein Glücksspiel, ob die Suchmaschine PDF-Treffer präsentiert, oder nicht, wie Craig Silverstein, der technische Direktor von Google, dem E-Zine Search Engine Watch mitteilte. Bis zum Wochenende will man bei Google alle Computer aktualisiert haben. Dann soll der Volltext von 13 Millionen PDF-Dateien durchsuchbar sein.

Die Suchmaschine stellt PDF-Treffer in ihrer Ergebnisliste durch ein vor den jeweiligen Verweis gestelltes "[PDF]" dar. Zum Anzeigen der Dokumente benötigt man natürlich einen Acrobat Reader. Um eine Recherche ausschließlich auf PDF-Dateien einzuschränken, kann der Benutzer nach den Suchbegriffen den "inurl:"-Befehl benutzen. So sucht die Abfrage "Europa inurl:pdf" nach PDF-Dateien, die den Begriff "Europa" enthalten. Search Engine Watch beschreibt in diesem Zusammenhang noch eine Reihe weiterer nützlicher Google-Befehle.

Dass mit Google jetzt eine große Suchmaschine PDF-Dateien indiziert, ist längst überfällig (Fireball Wissen durchsucht zwar auch PDF-Dateien und Dokumente anderer Typen, beschränkt sich dabei aber auf die Server im deutschen Forschungsnetz). PDF ist neben HTML inzwischen ein De-facto-Standard für die plattformübergreifende elektronische Dokumentenverteilung. Da PDF dem Designer mehr Einfluss auf Typografie und Layout der Dokumente gibt, finden sich viele Firmenprospekte, aber beispielsweise auch etliche technische Dokumentationen in PDF-Form im Web. Es ist wohl nur eine Frage der Zeit, bis sich Google oder eine andere Suchmaschine weiterer Dokumentformate annimmt: .doc (Word), .xls (Excel) et cetera ... (jo)