无需写代码的高效在线爬虫程序spider-flow

开源源码 管理员 3年前 (2022-01-12) 1695次浏览 0个评论

spider-flow是一款无需写代码,即可智能高效运行的在线爬行平台,源码在gitee和github都可下载,平台以流程图的方式运行,是一个高度灵活可配置的爬虫平台,主要特性如下:

支持Xpath/JsonPath/css选择器/正则提取/混搭提取
支持JSON/XML/二进制格式
支持多数据源、SQL select/selectInt/selectOne/insert/update/delete
支持爬取JS动态渲染(或ajax)的页面
支持代理
支持自动保存至数据库/文件
常用字符串、日期、文件、加解密等函数
支持插件扩展(自定义执行器,自定义方法)
任务监控,任务日志
支持HTTP接口
支持Cookie自动管理
支持自定义函数

无需写代码的高效在线爬虫程序spider-flow

源码下载地址:GitHub – ssssssss-team/spider-flow: 新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。

spider-flow: 新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。 (gitee.com)

喜欢 (2)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址