Phantom-Surfer

Website-Automatisierung mit PhantomJS und CasperJS

Praxis & Tipps | Praxis

Selbst im Web herumzusurfen ist ja ganz nett. Aber um Routineaufgaben könnte sich auch eine Maschine kümmern – etwa Informationen zusammentragen oder Websites testen. Dafür gibt es PhantomJS und CasperJS.

Statt Inhalte von Hand mit dem Browser aus einer Webseite herauszukratzen, kann man Seiten auch automatisiert mit der Programmiersprache der Wahl abrufen und auswerten. Vielseitiger erledigt das allerdings PhantomJS, denn dahinter verbirgt sich ein kompletter WebKit-Browser, der fließend JavaScript spricht. Daher kann PhantomJS auch dynamisch generierte Inhalte einlesen. Und auch wenn die Seiten bei PhantomJS nicht auf dem Bildschirm erscheinen, kann JS doch Screenshots von ihnen anfertigen.

Ein weiterer Aufgabenkomplex für PhantomJS sind Tests: Was passiert, wenn ich auf diesen Button klicke? Wie viele Treffer listet die interne Suchmaschine auf? Funktioniert die Registrierung neuer Benutzer? Der „kopflose“ Browser, wie ihn seine Macher beschreiben, weil er nicht auf dem GUI in Erscheinung tritt, kann auch den gesamten HTTP-Dialog speichern. Und schließlich steckt PhantomJS in anderen Projekten, die eine Webseite rendern, aber nicht anzeigen – zum Beispiel in uncss, das unbenutzte Stylesheets beseitigen und so die Größe von CSS-Dateien massiv reduzieren kann [1].

Phantom-Installation

PhantomJS läuft unter allen drei großen Betriebssystemen; es setzt kein GUI voraus, arbeitet also sogar auf einem Linux-Server ohne grafische Oberfläche. Binarys stehen unter www.phantomjs.org bereit. Noch einfacher geht es über npm, den Paketmanager von Node.js, das Sie von www.nodejs.org herunterladen und installieren können. Damit genügt zur Einrichtung von PhantomJS folgende Zeile in der Eingabeaufforderung:

npm install -g phantomjs

Danach können Sie mit phantomjs eine interaktive Konsole starten. Darin erfahren Sie zum Beispiel mit window.navigator Details über den Browser oder mit phantom.version die Software-Version – ähnlich wie in Chromes Web Inspector oder ähnlichen Browser-Debuggern. ...

Sie möchten wissen, wie es weitergeht?

Phantom-Surfer

1,49 €*

c't 26/2014, Seite 176 (ca. 4 redaktionelle Seiten)
Direkt nach dem Kauf steht Ihnen der Artikel als PDF zum Download zur Verfügung.

Artikel-Vorschau
  1. Phantom-Installation
  2. Sammelwerkzeug
  3. Screenshots
  4. Code einschleusen
  5. Sandkasten
  6. Scraping
  7. Selbst-Surfer
  8. Phantom-Tabs
  9. Notizen
  10. Phantomschmerzen
  11. Fantomas
  12. Geister-Browser
  13. Engine-Wechsel

Lesen Sie hier die Verbraucherinformationen

* Alle Preise verstehen sich inklusive der gesetzlichen MwSt.

Als c't-Plus-Abonnent gratis lesen

weiterführende Links

Kommentare

Infos zum Artikel

Kapitel
  1. Phantom-Installation
  2. Sammelwerkzeug
  3. Screenshots
  4. Code einschleusen
  5. Sandkasten
  6. Scraping
  7. Selbst-Surfer
  8. Phantom-Tabs
  9. Notizen
  10. Phantomschmerzen
  11. Fantomas
  12. Geister-Browser
  13. Engine-Wechsel
8Kommentare
Kommentare lesen (8 Beiträge)
  1. Avatar
  2. Avatar
  3. Avatar
Anzeige
weiterführende Links
  1. Zu diesem Artikel hat die Redaktion noch folgendes zusammengestellt:

    Links (7)

Anzeige