文章内容有,但是关关采集返回121 空章节
求解决方法思路! 贴个图看看 admin 发表于 2017-9-13 11:42贴个图看看
但是这个地址是有文章内容的
规则是<div id="content">((.|\n)+?)</div>
前面的章节可以获取到,不知道 是真么原因呢
天地初开 发表于 2017-9-13 11:54
但是这个地址是有文章内容的
规则是((.|\n)+?)
前面的章节可以获取到,不知道 是真么原因呢
这个站列表章节有空格,但是不影响内容的采集。解决办法:
1、采集器使用debug模式,这种不影响采集的不让的他告警。
2、检查修改采集规则,跳过空章节。
admin 发表于 2017-9-13 14:05
这个站列表章节有空格,但是不影响内容的采集。解决办法:
1、采集器使用debug模式,这种不影响采 ...
谢谢管理的热心帮助苏,采集器debug模式要怎么弄,不会要自己重新编译个debug版本吧。这个121章节,我后来发现,只要我重新采集一次就会采集到这个空章节,然后有断在另一个空章节处,不会是采集的太快了吧 天地初开 发表于 2017-9-13 17:02
谢谢管理的热心帮助苏,采集器debug模式要怎么弄,不会要自己重新编译个debug版本吧。这个121章节,我后 ...
debug是在采集器里设置的,不需要重编译。你可以采集的时候延时5秒采集观察看看。 admin 发表于 2017-9-13 17:30
debug是在采集器里设置的,不需要重编译。你可以采集的时候延时5秒采集观察看看。
确实是采集过快 导致的,有的网站不会,为什么这个网站会空章节,我开始以为他是用了js随机出现空章节的。
谢谢管理大大的指导:loveliness:
页:
[1]