天地初开 发表于 2022-4-23 16:00:00

文章内容有,但是关关采集返回121 空章节

求解决方法思路!

admin 发表于 2022-4-23 16:00:00

贴个图看看

天地初开 发表于 2022-4-23 16:00:00

admin 发表于 2017-9-13 11:42
贴个图看看

但是这个地址是有文章内容的
规则是<div id="content">((.|\n)+?)</div>
前面的章节可以获取到,不知道 是真么原因呢



admin 发表于 2022-4-23 16:00:00

天地初开 发表于 2017-9-13 11:54
但是这个地址是有文章内容的
规则是((.|\n)+?)
前面的章节可以获取到,不知道 是真么原因呢




这个站列表章节有空格,但是不影响内容的采集。解决办法:
1、采集器使用debug模式,这种不影响采集的不让的他告警。
2、检查修改采集规则,跳过空章节。

天地初开 发表于 2022-4-23 16:00:00

admin 发表于 2017-9-13 14:05
这个站列表章节有空格,但是不影响内容的采集。解决办法:
1、采集器使用debug模式,这种不影响采 ...

谢谢管理的热心帮助苏,采集器debug模式要怎么弄,不会要自己重新编译个debug版本吧。这个121章节,我后来发现,只要我重新采集一次就会采集到这个空章节,然后有断在另一个空章节处,不会是采集的太快了吧

admin 发表于 2022-4-23 16:00:00

天地初开 发表于 2017-9-13 17:02
谢谢管理的热心帮助苏,采集器debug模式要怎么弄,不会要自己重新编译个debug版本吧。这个121章节,我后 ...

debug是在采集器里设置的,不需要重编译。你可以采集的时候延时5秒采集观察看看。

天地初开 发表于 2022-4-23 16:00:00

admin 发表于 2017-9-13 17:30
debug是在采集器里设置的,不需要重编译。你可以采集的时候延时5秒采集观察看看。

确实是采集过快 导致的,有的网站不会,为什么这个网站会空章节,我开始以为他是用了js随机出现空章节的。
谢谢管理大大的指导:loveliness:
页: [1]
查看完整版本: 文章内容有,但是关关采集返回121 空章节