小玖采集系统

小玖采集规则教程

视频教程

基础教程

增强功能

发布接口插件

请下载对应您程序系统的插件, 主页内的安全码和插件的安全码必须一致!安全码全手打,越长越复杂越安全!Emlog Typecho WordPress Zblog

关于多页网址的获取

例如某个网站的第一页到第五页的网址是

https://m.huabaike.com/yhjq/p1.html
https://m.huabaike.com/yhjq/p2.html
https://m.huabaike.com/yhjq/p3.html
https://m.huabaike.com/yhjq/p4.html
https://m.huabaike.com/yhjq/p5.html

可以看到唯一变动的数字是 1,2,3,4,5,那么我们的其实网址

https://m.huabaike.com/yhjq/p[地址参数].html

数字范围是采集范围1-5 等于从第一页采集到第五页

元素获取

.joe_main 表示要取Class为joe_main元素所在区域的内容

#joe_main 表示id为joe_main元素所在区域的内容

<h1>*</h1> 表示为取h1标签中间的内容

内容元素获取

多个内容元素可以用逗号隔开,比如

.content,#post

删除内容指定元素

可以删除内容中不需要的元素,写法如

.content,#post
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
小玖采集系统-小玖网_综合网创资源_优质付费资源_知识付费网课平台_创业项目
小玖采集系统
此内容为免费阅读,请登录后查看
0
免费阅读
评论 抢沙发

请登录后发表评论

    暂无评论内容