miércoles, octubre 19, 2011

Extraer todos los enlaces de una pagina con PHP

Si tenemos montado un servidor apache, esto se puede hacer usando la funcion preg_match_all de php


<?php
$url = "http://www.google.com.pe";
$html = file_get_contents($url);
preg_match_all("/<a[^>]*"."href=[\"|\'](.*)[\"|\']/Ui", $html, $enlaces);
$enlaces = $enlaces[1];

foreach($enlaces as $enlace){
    echo $enlace."<br>\n";
}
?>

Esto lo guardamos en un archivo *.php lo ejecutamos y tenemos el listado de todos los enlaces de la pagina indicada en $url.

No hay comentarios.: