我是亓八九十!之前我发布过一款wx搜一搜下拉关键词的工具,这几天抽空优化了一下,优化了OCR识别的区域准确性,以及新增了对相关搜索词的识别和提取。
今天我在这和大家做一下技术交流,顺便讲下wx搜一搜下拉关键词和相关搜索词工具的开发和使用教程。
关键词OCR识别代码交流
我使用的是python3.7,适合新手开发些小软件的工具。
使用百度OCR通用识别接口(每月有免费1000次调用额度)
开发思路:打开电脑搜一搜客户端,获取绑定窗口,定义起始关键词。使用代码控制自动输入,同时使用百度OCR截图区域识别文字,保存excel。
下拉关键词及相关搜索词工具功能概念介绍
下拉关键词。
概念如下图:当你输入搜索词后,会自动出现下拉关键词,我把这个叫下拉关键词。通过ocr对特定区域文字识别后,都保存到excel中。
相关搜索词。
概念如下图:当你输入搜索词,点了搜索之后,最右边出现的相关搜索,这里的词语叫相关搜索词,同理,使用ocr识别特定区域文字后保存excel。
关键词与相关搜索词工具操作教程
软件目录文件介绍
ocrkey.ini文件是填写百度ocr识别接口的key。
ip.txt这个文件不要动。
authcode.txt是填写授权码文件。
下拉搜索词提取exe是专门提取上述讲的下拉词的工具。
相关搜索词提取exe是专门提取上述讲的右边相关词的工具。
界面以及功能点解释
1)关于提取方式:
a.循环提取指输入一个根关键词,再设定要循环的行数。
b.循环提取行数设置1,意思是第一次提取的9个词为一行,然后会把这9个词都再按照根关键词循环一遍。
c.指定提取是指:先把要提取的不同根关键词放在txt文件里。
d.指定提取选择txt文件后,程序会按照txt每行的词去输入并提取一次相关的关键词。
2)保存路径就是你要保存的路径。
准备工作
创建百度应用并申请API Key访问百度开放平台:首先,访问百度开放平台官网并登录你的百度账号。
https://console.bce.baidu.com/
找到文件识别项目,创建应用。 创建应用:在公有云服务页面,点击“创建应用”按钮。填写应用名称、应用类型、应用描述等信息,并选择你需要使用的OCR功能(如通用文字识别等)。申请API Key:创建应用成功后,你将获得一个唯一的API Key。这个Key将用于后续调用OCR接口时进行身份验证。请妥善保管你的API Key,不要泄露给他人。可领取免费资源,每月1000次的免费额度,够我们一般人使用了。基本就是免费了。使用操作
打开软件目录ocrkey.ini文件,自行填写上述百度ocr的key。
打开authcode.txt文件填写授权码
根据需要双击你需要使用的程序
打开电脑版微信,点击打开搜一搜主页面,先随便填一个词点击搜索到最终页面,切记这时候关闭微信,不是退出,是关闭最小化到桌面右下角!注意啊,不是点击最小化,是点击×关闭。只留搜一搜的页面。
软件选择循环提取还是指定提取,选择循环提取,就在软件界面输入根关键词,和循环行数(默认1,一般设置1结果会有90个关键词)。选择指定提取需要选择txt文件,就是你把不同的根关键词放在txt文件里,一行一个。
点击提取关键词按钮。中途不要动鼠标和键盘,直到程序结束。最好的操作就是只留搜一搜窗口和程序窗口进行操作。
好了,以上就是我使用python和百度ocr识别技术做的工具,在这里和大家做下交流。关注我,后续会继续推出实用工具技术交流。