大家好,请教大伙一个问题,就是偶用“文章采集”的时候,一次采集文章20篇,查看了一下才发现,文章的标题是采集到了,可是文章的内容并没有采集到,请问如何解决?
谢谢
采集是用系统自带的admin5的
采集规则如下:
<?php
/*以下为采集的规则,带“★★★★★”的项目,用户可以根据需要自行修改,其他的尽量不要修改。*/
//★★★★★ 开始采集的URL
$BEGIN_URL="http://www.admin5.com/browse/177/index.shtml";
//★★★★★ 采集的数量,请勿填写过大,建议填写100
$COL_LIMIT_NUM = 100;
//被采集的网站的编码
$WEB_CHARSET="gb2312";
//获取文章URL的正则表达式
$VIEW_URL_P='/\/article\/(\d{8,8})\/(\d{6,6}).shtml/isU';
//★★★★★ 文章URL的正则匹配项的范围, array("1","100","999") 表示匹配的第一项的范围是100至999
$VIEW_URL_RANGE=array(
array("1","20100825","20150909"),
array("2","100000","999999"),
);
//获取文章URL的前缀
$VIEW_URL_PRE='http://www.admin5.com';
//文章标题的正则表达式
$COL_TITLE_P='/<h1>(.*)<\/h1>/isU';
//文章标题的正则表达式的匹配项
$COL_TITLE_P_N=1;
//文章标题中需要替换的字符串,请使用正则表达式
$COL_TITLE_REPLACE_R=array(
"/6kbbs论坛/is"=>"6KBBS官方论坛",
);
//文章内容的正则表达式
$COL_CONTENT_P='/<div id=\"arctext\">(.*)<\/div>(.*)<div class=\"author\">/isU';
//文章内容的正则表达式的匹配项
$COL_CONTENT_P_N=1;
//文章内容中需要替换的字符串,请使用正则表达式
$COL_CONTENT_REPLACE_R=array(
"/6kbbs论坛/is"=>"6k论坛",
);
$IS_DEBUG=false;
?>