52杰奇论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 6092|回复: 0

基于百度翻译API的火车头PHP翻译插件,适用所有火车头采集器版本

[复制链接]

591

主题

249

回帖

100万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1002202
发表于 2022-4-23 16:00:00 | 显示全部楼层 |阅读模式
1.修改火车头的PHP环境
将最前面的分号“;”删除并保存即可,这样火车头数据采集器就可以正常运行这个PHP翻译插件了。
这个插件是基于百度翻译开放平台的,所以必须要先到百度翻译开放平台申请到appID和密钥之后,插件才能正常使用。
申请百度开放平台的帐户很简单,只要填写姓名、Email、手机就可以了,审核也很快。最主要的是百度翻译开放平台审核也很宽泛,基本上只要你填的信息是真实的就会通过。
3.修改代码设置插件
14、15行分别为你采集的语言和需要翻译成什么语言,例如插件默认的是采集的中文,用“zh”表示、需要翻译为英文,用“en”表示,你可以根据你的具体情况修改,所有语言的标识码查看下面的表格。
需要特别说的是翻译方式有两种,一种是不保存采集的内容直接翻译,另一只是保存采集的内容再翻译;插件上默认的“标题”就是不保存采集的内容,软件会直接保存翻译后的内容,“内容”标签就是保存了采集的内容,同时也保存了翻译后的内容。对比一下两行代码前后标签名的区别,应该就能看出规律。
↑上图可以看到,我采集了标题、关键词、内容三个标签,并且将这三个标签都翻译成了英文。但是翻译后的显示有区别,“标题”这个标签是直接显示了翻译后的英文内容,没有采集的中文,而关键词和内容两个标签都保留了采集的中文原文,同时另外用一个标签来保存了翻译后的英文。设置方法需要修改插件的“BaiduTranslateApi.php”文件,见下图。

代码如下(注意修改引号内的内容为你火车头的实际标签名):
$LabelArray['翻译后的标签名'] = translate($query = $LabelArray['采集标签名']);
如果你的火车头采集工具能正常采集到内容,但是不显示翻译的内容,那肯定是你的插件设置不对,请仔细阅读插件代码末尾的注释说明,按说明和事例的规则进行设置。如果翻译的内容报错,请看下面的错误代码,根据提示检查。
插件内置了大部分的错误,只要插件设置不正确的话火车头的采集结果就会显示错误内容,基本上设置不正确的话看采集结果就能知道怎么解决,下面是更详细的错误和解决方法。
错误码
含义
解决方法
52000成功
52001请求超时重试,或将插件代码第1行的“30”改大一点试试。
52002系统错误重试
52003未授权用户检查您的APPID设置是否正确
54000必填参数为空检查插件的采集规则,看看是否没有采集到内容
54001签名错误请检查您的密钥是否填写正确
54003访问频率受限采集的频率太高,过段时间或调整下采集间隔试试
54004账户余额不足余额不足,您的免费字符已用完或余额不足
54005长query请求频繁3s后再试,或调整采集时间间隔,或调整采集的文章长度试试
58000客户端IP非法检查个人资料里填写的IP地址是否正确
可前往管理控制平台修改
IP限制,IP可留空
58001译文语言方向不支持译文语言方向错误,请检查您设置的目标语言标识码是否正确。


百度翻译API支持28种语言互译,各语言标识码如下:
语言标识码
名称
auto自动检测
zh中文
en英语
yue粤语
wyw文言文
jp日语
kor韩语
fra法语
spa西班牙语
th泰语
ARa阿拉伯语
ru俄语
pt葡萄牙语
de德语
it意大利语
el希腊语
nl荷兰语
pl波兰语
bul保加利亚语
est爱沙尼亚语
dan丹麦语
fin芬兰语
cs捷克语
rom罗马尼亚语
slo斯洛文尼亚语
swe瑞典语
hu匈牙利语
cht繁体中文
vie越南语
免费版火车头数据采集软件不能使用本插件,因为免费版的火车头采集器禁止了插件功能,其实免费版火车头采集软件也不能用任何插件。
我测试了下,字符的规则为:汉字、英文字母、阿拉伯数字、标点(含中英文)、空格均计算为1个字符,回车计算为4个字符。
下载地址

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|52杰奇论坛  

GMT+8, 2024-3-29 17:33 , Processed in 0.096810 second(s), 24 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表