php 信息采集程序代码
php 信息采集程序代码
发布时间:2016-12-29 来源:查字典编辑
摘要:复制代码代码如下:通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配

复制代码 代码如下:

<?

//采集首页地址

$url="http://emotion.pclady.com.cn/skills/";

//获取页面代码

$rs=file_get_contents($url);

//设置匹配正则

//$fp=fopen("text.txt","a");

//$fw=fwrite($fp,$rs);

//fclose($fp);

/*<I class=titles><A

href="http://emotion.pclady.com.cn/skills/0903/376476.html"

target=_blank>留住你身边的好男人</A></I>*/

$preg='/<is+class="titles"><as+href="[^>]+">(.*)</a></i>/i';

//进行正则搜索

preg_match_all($preg,$rs,$title);

//计算标题数量

$count=count($title[0]);

echo $count."<br>";

//通过标题数量进行内容采集

for ($i=0;$i<$count;$i++){

//设置内容页地址

$pr='/<as+href="[^>]+">/isU';

preg_match_all($pr,$title[0][$i],$jurl);

$substr=substr($jurl[0][0],9);

$curl=substr($substr,0,-18);

//获取内容页代码

$c=file_get_contents($curl);

//设置内容页匹配正则

$pc='/<as+href="[^>]+">/i';

//进行正则匹配搜索

preg_match($pc,$c,$content);

//输出标题

echo $title[0][$i]."<br>";

echo $title[1][$i]."<br>";

$concount=count($content[0]);

echo $concount."<br>";

echo $content[0][0];

for ($j=0;$j<$concount;$j++){

}

}

?>

通过检测,$c已经是内容页的数据流了,可是$pc这个的正则表达式为什么只匹配<这个字符其他的都没有呢,是因为我上面用了subsrt()函数吗?还是什么问题?麻烦各位大侠指点迷津啊?

推荐文章
猜你喜欢
附近的人在看
推荐阅读
拓展阅读
相关阅读
网友关注
最新php教程学习
热门php教程学习
编程开发子分类