采集帝国CMS图集前,我们需要知道帝国CMS图片集的数据库格式是怎么样的。数据库格式如下:
https://www.wdzzz.com/d/file/20191009/01a72a5bff2b3638d53c90e07a2ef3f4.jpg::::::https://www.wdzzz.com/d/file/20191009/01a72a5bff2b3638d53c90e07a2ef3f4.jpg::::::暴走兔子 https://www.wdzzz.com/d/file/20191009/d861b9ec1930588a20cd30aa29ca914f.jpg::::::https://www.wdzzz.com/d/file/20191009/d861b9ec1930588a20cd30aa29ca914f.jpg::::::暴走兔子
整理格式为:
大图路径::::::小图路径::::::名称
注意每段结尾是换行,也就是一条图片集一行的格式排列。
所以我们采集的时候也就需要把采集到的数据整理成上面对应的格式才行。
采集演示
这里我们用到的杰灵采集器来作为演示软件,其他软件可以自行研究。不会杰灵采集器的可以看看以往的教程。
相关信息
我们直接跳过软件的基本方法,直接讲解利用采集器采集帝国CMS图片集并整理数据和入库。
如上图演示,我们直接用杰灵采集器的正则功能提取需要采集的图片集图片路径,然后按照帝国CMS图片集的数据库格式整理,最后添加换行符。
这样就完全符合了帝国CMS图片集的数据库格式。
接下里是如何入库了,我们需要修改下杰灵采集器的发布接口。
只需要在
//更新栏目信息数
的上方加上就可以了
$morepic=$_POST[morepic]; if ($morepic) $empire->query("update ".$infotbr['tbname']." set morepic='$morepic' where id='$id'");
注意修改数据表,主表为 tbname,附表为datatbname。
相关专题
- THINKPHP随风自动采集百度知道问答系统源码v22.5 [2024-07-17]
- wordpress小白网创自动采集发布插件1.3版本修复版 [2024-07-10]
- 帝国cms自带采集和火车头采集器哪个更好用 [2024-04-25]
- [Chrome浏览器插件]anypicker可视化爬虫采集插件 [2024-04-22]
- TTC线报网实时自动采集程序源码,带模板和采集器 [2024-01-16]