首页 > php代码 > php采集后的处理

php采集后的处理

版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章原始出版、作者信息和本声明。否则将追究法律责任。http://blog.csdn.net/mayongzhan - 马永占,myz,mayongzhan


<?php


/**

 * @name 采集后的处理.php

 * @date Sat Dec 22 02:07:45 CST 2007

 * @copyright 马永占(MyZ)

 * @author 马永占(MyZ)

 * @link http://blog.csdn.net/mayongzhan/

 */

 

//采集后的文件,然后那来进行处理.这里的东西让我抄了5本书,是哪的不方便提供,自己找找吧.

 

header('Content-Type:text/html;charset=utf8');

 

function writer($content,$url)

{

    $fp = fopen($url, 'ab');

    fwrite($fp, $content);

    fclose($fp);        

}

 

//从1到136页的内容一次合并.这个是最爽的...

 

for ($i=1;$i<136;$i++) {

    $str = file_get_contents('./myz/'.$i.'.shtml');

    preg_match("/(<h1>)(.*?)(<//h1>)(.*?)(<div class=/"artibody/" id=/"artibody/">)(.*?)(<//div>)/s",$str,$arr);

    $arr[6] = preg_replace("/(<span[^>]+>.*?<a[^>]+>)(.*?)(<//a><//span>)/s","$2",preg_replace("/<p>|<//p>/","/r/n",$arr[6]));

    $result = "/r/n------------------------------------------------/r/n------------------------------------------------/r/n------------------------------------------------/r/n".$i."----------------马永占的目录编号:".$arr[2]."/r/n------------------------------------------------/r/n------------------------------------------------/r/n------------------------------------------------/r/n".$arr[6];

    writer($result, "./myz/all.txt");

}


永久地址:http://www.phprm.com/code/bf12f7cea9d9497a2993f37296e00884.html

转载随意~请带上教程地址吧^^

标签:none

发表留言