大家好,我是淘小白~
百度知道聚合采集软件说明文档,之前只做过一个演示视频,没有做详细的介绍,今天来结合更新的内容,来给大家做一个详细的介绍
1、软件语言:Python
2、逻辑:根据关键词批量采集 ---- 聚合多篇文章 ---- 保存到本地txt
3、配置文件说明:
我们拿到软件之后,先修改config.ini配置文件,里面包含下面几个自定义内容:
path :关键词调用路径;
bf_num :并发数量,最大值20,超过20软件自动改成20并发;
out_path :数据输出路径;
title_mode:标题模式,0 1 2 3 4,意义分别如下:
关键词单标题:1
知道标题单标题:2
关键词+知道标题双标题:3
知道标题+知道标题:4
随机标题模式:0
title_f ,title_b :双标题连接符 , 注意:如果使用空格链接,请使用英文双引号引起来,例如:" ",这代表使用空格链接;
title_len :标题长度限制过滤,如果标题长度大于30,则过滤掉;
article_seq :提取顺序开关,文章ID提取顺序是否随机打乱,比如:123456789... 顺序文章,随机打乱:951326487...
0 按照默认顺序提取,1 打乱文章顺序
article_num: 文章聚合数量自定义,自定义文章聚合数量:最小为2 ,最大为10 ,设置为0,则为3-5篇文章随机组合

以上主要的功能就是根据客户的需求,增加的一些内容,后面还会继续收集客户的一些问题,来进行优化升级。
4、使用需要购买授权,绑定电脑;
5、聚合数据自动配图;
6、有需要根据百度知道聚合数据自定义逻辑的朋友,可以联系我定制逻辑;
7、其他注意事项:keywords.txt、config.ini两个文件尽量使用notepad++打开编辑,尽量不要使用记事本编辑,不同电脑,可能存在不同的未知错误!
8、演示采集视频:
百度知道采集工具软件演示,文章组合聚合网站更新,快速收录,批量采集