经验分享

杰灵采集器过滤方法总结

我的站长站 2019-07-18 人阅读

杰灵采集器采集完成后的内容怎么二次洗稿?怎么过滤掉不需要的字符、HTML代码了?

本教程我的站长站主要讲解杰灵采集器如何对采集内容进行过滤的方法总结。

方法一:HTML过滤

杰灵采集器过滤方法总结
杰灵采集器截图

HTML过滤方法为杰灵采集器自带功能,点击打开一个字段,规则区右键新建一个“HTML过滤”,选择需要过滤的HTML标签,点击“确定”-“保存”即可实现。

方法二:内容替换法

杰灵采集器过滤方法总结
杰灵采集器截图

有时候HTML过滤不能够满足过滤需求,比如需要过滤的HTML标签,HTML替换里面没有。这时候可以用到内容替换方法。

点击打开一个字段,规则区右键新建一个“替换”,左边填入需要替换的内容,右边填入空白,点击“确定”-“保存”。这样就可以把需要过滤的内容替换成空白,达到过滤的效果了。

方法三:正则过滤法

杰灵采集器过滤方法总结
杰灵采集器截图

这里的正则过滤法需要会正则表达式了,只需要勾选“正则替换”就行。

相关专题
采集
采集
2022-03-03 1273

数据采集是网站运营与内容整理的常用技能,合理合规的采集方式能大幅提升内容整理效率。我的站长站整理各类实用采集工具、主流采集软件资源、零基础采集实操教程,讲...