为什么火车头只能采集到文章的前20张图片?烨晟网络(www.yeshengweb.com)最近在用火车头采集今日头条的内容,刚开始没觉得有问题,后来发现一旦文章图片很多,就只能采集到20张图片,很是纳闷。

咨询过后,烨晟网络得知原来是因为是接口上传,PHP配置中有一个限制max_file_uploads,即允许同时上传文件的最大数量,默认是20,所以之前一篇文章只能采集前20张图片,修改为大一些的值,比如100或者1000都可以,这样就可以解决网站的问题了。

为什么火车头只能采集到文章的前20张图片

虽然这个问题在修改之后解决了,但是之前发布了很多文章,虽然一篇文章大于20张图的毕竟在少数,但还是有不少这样的文章发布了出去,超过20张的图片就变成了图片死链,如果一篇篇文章去修改,那确实工作量有点大,感觉还是利用规则直接清理网站根目录下的所有图片地址比较合适,当然这个主要是错误博客的其他图片都已经搬到二级域名上,或者说搬到了另外一个服务器上。

火车头采集确实挺好用的,但是一旦有微小的问题,可能对网站带来非常不好的影响。且用且珍惜吧。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。