相信很多玩帝国CMS的人都使用过内置的采集器,总体来讲功能还是很强大的。看似一堆的配置,其时仔细研究下也并不难(尤其是会正则表达式的同学们),说难的只有两种原因:
1、不懂正则表达式
2、没耐心。一看到一堆的配置就马上被吓倒了。
在帝国CMS功能强大采集器下,却有着一个很是让大家头疼的硬伤,那就是在采集入库里,经常会超时。超时的现象就是一片白屏,这样就会让我们进也不是,退也不是。最后还是不得以后退,最后的结果一些信息已经成功入库,但是采集数据表里的数据依然存在,如果你再次入库,就会造成信息的重复性,这是大家最不希望发生的情况。
出现超时的原因
一般服务器配置运行的脚本默认是30秒,在我们采集信息的时候,内容常常包含很多图片,所以会出现超时。
我们常常说要对症下药,既然我们知道了超时的原因,那么就修改一下脚本运行的时间,处理的方法如下:
打开/e/admin/ecmscj.php在第7行添加如下代码:
set_time_limit(0);//不限制脚本运行的时间
- THINKPHP随风自动采集百度知道问答系统源码v22.5 [2024-07-17]
- wordpress小白网创自动采集发布插件1.3版本修复版 [2024-07-10]
- 帝国cms自带采集和火车头采集器哪个更好用 [2024-04-25]
- [Chrome浏览器插件]anypicker可视化爬虫采集插件 [2024-04-22]
- TTC线报网实时自动采集程序源码,带模板和采集器 [2024-01-16]