以下是php采集实例和正则获取里面的内容的例子,可采集https网站上的内容
$url = "http://www.aspbc.com";//要采集的网址
$str = socketdata($url); //获取html内容
$preg="/<title>(.*?)<\/title>/is";//正则的规则是寻找一个title标签的内容preg_match( $preg,$str,$result);//php正则表达式 采集多条内容有preg_match_all
$news_title = $result[1]; //输出标题
//采集函数
function socketdata($url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_HEADER,0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);//禁止调用时就输出获取到的数据
curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER,false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST,false);
$result = curl_exec($ch);
curl_close($ch);
return $result;
}