智能爬虫能力:支持多线程、分布式智能爬虫。可定义增量、全量模式,自由选择爬取频率,粒度支持分钟级,支持按周,月遍历一次全量网站等。
智能分析能力:主要对抓取的分析数据进行内容识别,支持文字、图片、音视频、OCR、APP识别与分析。可根据需要灵活配置智能分析引擎。
不良内容库:基于现有不良内容库与第三方信息库,可以不断识别与更新不良,不良APP,不良信息库。
架构方便部署:可以灵活地将数据采集与智能爬虫深度结合,模块化设计,本地引擎与网络引擎相结合。
应用灵活扩展:系统采用分布式设计,所有服务程序均可部署在不同主机上,在系统扩容或升级时,可利用新增服务器部署应用服务程序,可以独立管控或者与其他现有系统联动管控。
产品概述
上海欣方网络内容与管控解决方案采用高性能采集设备和机器学习模型,能够针对海量数据和文件进行业务建模和数据挖掘,采用分布式爬虫采集数据,完成数据采集功能,实现网络内容识别、分析、管理与管控。
产品功能
产品特点
产品架构