首页 > php代码 > 新闻采集代码

新闻采集代码

这个是用fopen取读远程文章的内容直接保存到本地了,这只是个简单的,仔细一点就是要分析要采集文章的结构,然后用正则取我们想要的内容,保存到数据并生成html文件就行了.

function getcontent($url,$html,$version,$google,$key1,$key2,$key3,$title)
{
    /*$ch =@curl_init($url); 
    ob_start();
    curl_exec   ($ch);   
    $retmsg=ob_get_contents();
    ob_clean();
    ob_end_flush();
    curl_close   ($ch); 
    */
    $retmsg=file_get_contents($url);
    这里可以用多种读取远程文章的办法
    $handle=fopen(getcwd().$html,'w+');
    $retmsg=str_replace(array('{google_version}','{google}','{key1}','{key2}','{key3}','{title}'),array($version,$google,$key1,$key2,$key3,$title),$retmsg);
    if(!fwrite($handle,$retmsg)){
        echo 'cant write<a href=# onclick=\"javascript:history.back();\">Back</a>';
    }else{
        echo "sava success<a href=# onclick=\"javascript:history.back();\">Back</a>";
    }
    fclose($handle);
}


本文地址:http://www.phprm.com/code/7c262dcb8f54560d17a872dc049ccec1.html

转载随意,但请附上文章地址:-)

标签:none

发表留言