大家好了,我是淘小白~
今天给大家介绍的软件是一个款驱动浏览器改写文章的软件,下面给大家做一下介绍说明:
Python编写的,使用的库是selenium库
1、整理头条文章网址,需要自己整理,也可以用易撰、小火花这种平台整理
放置在指令的TouTiao_ids.txt中去
2、软件自动采集头条的图片和文章,分别保存在./data/imgs 、./source/,图片是jgp格式,文章数据是txt格式
图片下载的时候,会对底部进行裁剪,主要是为了把水印裁减掉。
这是采集的数据,图片和txt
3、软件采集到文章数据之后,除了保存到本地以外,会执行下一个步骤,gpt改写,软件驱动谷歌浏览器,打开gpt官网,将指令和文章数据自动发给gpt进行改写
4、文章经过设定的指令改写完成之后,会自动配图,将文章保存到本地,保存成docx的word文档
以上是软件的具体逻辑。
1、反爬问题,使用Python的selenium库会遇到gpt官网的cloudflare机器验证,这个问题是很头疼的问题,不过已经解决掉了。
2、GPT改写遇到道德约束,软件遇到道德约束不会出数据,软件监测到会自动跳过这篇文章;
3、输入文章太长报错,输入文章太长,软件会自动对文章进行裁剪,裁剪完会再次输入到GPT进行改写;
4、生成过程中断,在文章生成的过程中,GPT会写到一半无法执行,软件监测到之后,会自动进行点击继续执行按钮,执行改写;
5、生成过程中二选一问题,在gpt生成过程中,会出现2个答案并写的问题,gpt会让你二选一,软件自动选择左侧答案,往下执行。
以上是gpt改写中遇到的几个问题,已经处理过,后面有遇到问题会继续优化。
1、改写指令
2、改写时间间隔,每篇文章采集改写完之后的暂停时间
3、改写网址,选择GPT4 还是GPT3.5
4、篇头篇尾
5、图片底部裁剪像素
客户截图:
头条自媒体文章图片采集,驱动浏览器使用GPT3.5 4.0改写文章软件,演示视频
20240301:增加 搜狐\微信 网址采集,把头条文章网址、搜狐文章网址、微信文章网址,放到网址文件中,软件可自动识别采集,并进行改写