不用写代码,0基础也能开发ai视觉工具,还免费!

背上行囊出发啦 2025-03-16 01:56:05

最近有一个叫小猫补光灯的app爆火,发布以后直接冲上了app store的付费榜第一名。更让人惊讶的是这款产品竟然是有一个不懂编程的博主,用a i只花了一个小时就完成了开发。没错,现在a i时代你不需要会写代码,只要脑子里面有想法,就可以很轻松的用a i开发这个产品。比如我我最近花了两个小时时间,给我的公众号做了一个带视觉识别的a i天天鉴宝功能。只需要拍一张图片发给他他就可以自动帮你检测出你拍的这个宝贝到底开不开门。

这个太。开门了。那当然我是为了给你们拍视频做了一个整合的产品哈。像这种a i视觉识别的技术,如果落地的话,还是有很多好的场景。比如说前段时间爆火的picture this这款产品,它的功能非常简单,你只需要拍一张植物的图片发给他他就可以精确的告诉你这是一个什么植物,并且这个植物的健康状态如何。

别小看这个简单的功能,这个产品在欧美一个月的流水有八千万。那除了植物识别以外,掌握了这个技术,你还可以开发很多有趣的场景。比如说做一个a i拍照背单词,比如说做一个a i穿搭评分等等。那么今天手把手教你如何做出这种带视觉识别的ai工具。那首先既然是a i工具,你得有一个好用的a i模型。

目前市面上主流的有三种方法。第一个是本地部署,这种需要有一个高性能的显卡。那如果你家电脑是顶配的设备,可以考虑这个方案。第二种是云服务器部署。云端部署的好处就是你不需要买显卡,但缺点是这个服务器它是按天计费的。

就好像你去网吧开了一台电脑,不管你是在打游戏还是在网吧趴着睡觉,只要你的电脑开着,闲暇时间也会在计费,实际计算下来成本其实不低。那第三种方案是a p i调用的方案,这也是我比较推荐的方案。a p i就是公司把他们的模型能力打包成一个现成的服务,你可以通过a p i接口去使用,不需要自己去部署了。就跟点外卖一样,你不需要在家里面开个餐厅,直接叫现成的就行。并且a p i这种方案是用多少收多少钱,你也不需要担心像云部署那样资源浪费。

那确定完用a p i的方案以后,接下来就选模型了。如果想要做一个我视频开头的ai鉴保功能,一定要选具备视觉能力的ai模型。那我在市面上对比了一下本视频,我选用的是质朴的g l m四v这款模型。这个模型可以识别图片和视频,我测下来感觉挺准的。最重要的他家实在太良心了,注册就送两千万的token,而且还有一个语言模型是完全免费给你用的,你敢信?如果你跟我一样是一个预算不多的新手,那在刚起步阶段强烈建议你去薅一下质朴的羊毛,最大程度的降低你的成本。

ok首先我们进入到质朴大模型开放平台这个官网,这个是网址。然后你需要注册一个账号,并且完成实名认证。当你实名认证完的时候,你就可以获得质朴他送的两千万额度的免费talk。就这个够你用很长时间了。o k领到它赠送的这个talking以后,我们点击右上角的控制台,然后这里有一个钥匙形状的按钮,我们点一下,这就是a p i的管理页面啊。

因为我之前已经做过测试了,所以我创建过。我们在这里新建一个a p i k起一个名字。比如说我起我自己山河这个a p i k就创建好了。这个密钥就相当于你的银行卡密码一样,你要自己保存好,不要发给别人哈。接下来我们回到控制台,在模型中心这里有一个模型广场,里面是质朴他们家不同的模型。

你可以看到他们家已经出了针对各种场景的不同用途的不同模型啊,我们用这个g l m四v plus啊,这是一个视觉模型,它可以阅读视频跟图片。同时这儿还有一个flash模型,这个是完全免费给大家用的。如果你要开发一些不需要太强推理能力的工具,就薅这个免费的够用了哈。接下来我们点这个文档去看一下它的接口文档啊,你可以看到这儿有很多东西,对吧?但你不要被它这个文档给吓到啊,它下面这里给了你代码,我们只需要复制这些代码就可以直接用。注意哈,这里一共给了四种代码可以选择,分别是传图片、传视频,然后同时又分本地上传跟网络u r l上传。

那为了方便给大家做视频演示啊,我就用u r l上传图片的方式进行演示。其他几种方法都是一样的,大家举一反三就行。那下一步你需要去下载一个代码编辑器,我用的是最近比较火的一。那当然如果说你比较喜欢用v s code也可以,只要能编辑代码都可以啊,逻辑都是一样的。安装好编辑器以后啊,我们打开这个,然后要新建一个文件夹。

比如说我在这里随便建一个一,然后创建打开。好,在这里呢我们点新建文件。新文件随便起个名字,然后注意这要打点p y这个后缀非常重要啊,因为这个证明它是一个python的文件。我们回到刚刚这个模型的页面,把这个代码复制粘贴过来。注意看哈代码里面已经写好了注释。

第二行引号里面的这个区域是填写你刚刚创建好的a p i k。我把我刚刚的a p i p这个山河复制了。粘贴到引号里面来。下面这里是替换模型的名字。因为你记得我们刚刚在模型广场上看到有很多模型嘛。

比如说你想用这个完全免费的flash模型,你就把这个模型的名字给复制了,替换到这个引号里面去就可以换模型。这一行是写提示词的,因为你这里是一个视觉识别的模型,所以一般我们这里的提示词就写让它识别视频或者图片里面的内容即可。然后第十六行这里它是替换图片u r l的地方,就是放一个图片的链接。我从网上随便找一张图片啊,然后我们复制这个图片的地址。把它替换进来。

注意哈这个图片的链接要是以这种点j p g或者是点p n g结尾的格式上面的全部都替换完成以后,然后你还需要安装一个质朴官方的python库啊,这个非常简单。我们点击上方的终端按钮,然后点击新建终端。ok然后我们从质朴官方的那个文档里面复制这个代码,粘贴到终端,按回车一般就可以安装。然后如果你遇到我这种情况也不要慌,这段代码前面再加两个词就可以了。o k这里大家不需要截屏记哈,所有的代码我都会整理到文档里面,方便你们复制。

我把这个文档放到了视频的结尾,等会直接取就行。o k因为这里我已经安装过了,所以它会这样显示,安装完成以后,我们就可以开始试运行了。我们点击右键运行python,在终端里面运行python文件。ok可以看到他已经把我们图片给识别出来了。图片里面有一个穿着灰色短袖,戴着黑色礼帽的白人。

那走到这一步啊,一些比较简单的小工具,其实你改一下提示时就已经可以实现了。但如果想要得到我视频开头的那种a i侵权鉴宝的效果,光有这一个还不够。我们还得再加一个语言模型进去,把阅读出来的图片信息发给语言模型,然后根据我们内置的提示词输出文案。那毕竟专业的事情要交给专业的模型去做嘛,这里我直接用这个免费的模型哈。然后还是同样的,我们点开文档,进入到他的文档里面,把这个代码给复制出来。

我们现在需要做的是把前一个图像识别的代码跟现在这个代码给串起来。这个非常简单,你直接丢给ai帮你写就行。如果你不会的话,你直接用我给你提供的代码。我们对接好以后呢,输入我们的提示词。那我视频里面演示到的所有的代码和提示词,我都整理到文档里面了,放在视频结尾复制了,直接用。

然后我们跑一下试试看。好,首先他先把这个图片给阅读出来了,对吧?然后生成评价。来,我们看一下成品。来双击翻转看看宝贝真是一个有趣的物件。啊,他会把这个全部都描述一遍。

关键的是,最经典的这个东西沉淀了太多故事,真假难辨。嗯。或许值几个馒头。ok是不是有那味儿了,你就说这个结果到底开不开门吧。他这个太。

那目前呢我们只是在本地跑通了。如果想跟我一样把它接入到公众号,或者是你想做一个工具网站的话,还需要额外去买一个服务器,把刚刚写好的代码部署上去就行了。那关于公众号部署的具体步骤呢,视频里面直接展示的话,大家复制代码可能有点不太方便。我把所有的步骤和代码都整理到文档里了,你只需要按照我文档里的教程直接复制代码就能搞定。那老规矩,记得给我点赞加关注,然后领取哈。

学a i记得关注我。



 

0 阅读:0

背上行囊出发啦

简介:感谢大家的关注