新闻采集代码
这个是用fopen取读远程文章的内容直接保存到本地了,这只是个简单的,仔细一点就是要分析要采集文章的结构,然后用正则取我们想要的内容,保存到数据并生成html文件就行了.
function getcontent($url,$html,$version,$google,$key1,$key2,$key3,$title) { /*$ch =@curl_init($url); ob_start(); curl_exec ($ch); $retmsg=ob_get_contents(); ob_clean(); ob_end_flush(); curl_close ($ch); */ $retmsg=file_get_contents($url); 这里可以用多种读取远程文章的办法 $handle=fopen(getcwd().$html,'w+'); $retmsg=str_replace(array('{google_version}','{google}','{key1}','{key2}','{key3}','{title}'),array($version,$google,$key1,$key2,$key3,$title),$retmsg); if(!fwrite($handle,$retmsg)){ echo 'cant write<a href=# onclick=\"javascript:history.back();\">Back</a>'; }else{ echo "sava success<a href=# onclick=\"javascript:history.back();\">Back</a>"; } fclose($handle); }
本文地址:http://www.phprm.com/code/7c262dcb8f54560d17a872dc049ccec1.html
转载随意,但请附上文章地址:-)