<?php
/*以下为采集的规则*/
// 开始采集的URL
$BEGIN_URL = 'http://news.163.com/special/0001386F/rank_news.html';
// 采集的数量,请勿填写过大,建议填写100
$COL_LIMIT_NUM = 20;
//被采集的网站的编码
$WEB_CHARSET="gb2312";
//获取文章URL的正则表达式
$VIEW_URL_P='/http:\/\/http://news.163.com\/(\d{8,8})\/n(\d{5,5}).html';
// 文章URL的正则匹配项的范围, array("1","100","999") 表示匹配的第一项的范围是100至999
$VIEW_URL_RANGE=array(
array("1","10","10"),
array("2","10000","99999"),
);
//获取文章URL的前缀
$VIEW_URL_PRE='';
//文章标题的正则表达式
$COL_TITLE_P='/<tr><td[^>]*>(<span>\d*<\/span>)?<a href="([^"]*)">([\s\S]*)<\/a><\/td><td[^>]*>(\d*)<\/td><\/tr>/iU';
//文章标题的正则表达式的匹配项
$COL_TITLE_P_N=1;
//文章标题中需要替换的字符串,请使用正则表达式
$COL_TITLE_REPLACE_R=array(
""=>"",
);
//文章内容的正则表达式
$COL_CONTENT_P='/<div id=\"content\">(.*)<\/div>(.*)<\!--<div id=\"ckepop\">/isU';
//文章内容的正则表达式的匹配项
$COL_CONTENT_P_N=1;
//文章内容中需要替换的字符串,请使用正则表达式
$COL_CONTENT_REPLACE_R=array(
""=>"",
);
$IS_DEBUG=false;
?>