Wie schreibt man am besten spider php

Ich möchte in php einen Spider schreiben. Wie liest man den Seiteninhalt, der Seite, die der Spider besucht, am besten in eine Variable, zur weiteren Verarbeitung ein?

1 Antworten zur Frage

Bewertung: 2 von 10 mit 1613 Stimmen

Videos zum Thema
YouTube Videos

Wie schreibt man am besten einen Spider in php?

Am einfachsten mit dem Befehl "file":
$lines = file ('Example Domain
$lines ist dann ein Array, das alle Zeilen der angegebenen Seite enthält. Um das Array gleich in einen einzigen String zu verwandeln, nimmst du "implode":
$html = implode ('', file ('Example Domain
Die String-Variable $html kannst Du anschließend nach Links durchsuchen lassen.
Soweit zum Parsen einer Seite, das Beispiel funktioniert nur wenn allow_url_fopen in der php.ini aktiviert ist.
Zum Spidern gehört neben dem Parsen auch noch die Pflege und Bereitstellung des Katalogs, vielleicht hilft Dir der folgende Artikel:
Building a Simple Search Engine with PHP - O'Reilly Media