AI时代,信息越来越爆炸,互联网所形成的注意力竞争生态,也在肉眼可见的加剧。在年初Deepseek爆火之后,这种实感也越来越强。
但对于大多数人来说,每天的时间都是有限的,空闲时间也通常是碎片化的,所以越来越难以接受较长信息的内容。收藏夹越来越满,但真正吸收的知识有限;害怕错过重要信息,产生焦虑。
像我前几天看到一期B站UP主“老蒋巨靠谱”的视频,《AI替代危机下全职业生存指南》,虽然自己很想认真听完,看看自己会不会被替代,但看到50多分钟的时长就有点让人劝退……
昨天,有个朋友还发来一篇播客“E185 对话微软中国CTO韦青:不是人类没有未来,是活成机器的人类没有未来”,他说这期节目讲得很棒,但我一看时长85分钟,瞬间就没了听下去的念头……
如何在有限的时间内,高效地获取长内容的核心信息?这个问题困扰了我很久,所以带着这个困扰,我开始尝试探索一些AI工具。
你喜欢一键总结吗?
其实像B站这样的平台也有类似的“AI总结”功能,一键即可对整个文章进行观点整理。
但B站上的这个总结工具还比较一般,如果你对整理内容质量、论证可信度有要求的话,你又会发现这些内容信息密度太高,如果没有更具体的案例支撑,其实并不容易吸收和理解。
(是的,又想快捷方便,又想高效地吸收知识……打工人好难啊)
而如果你想直接下载视频字幕,然后按照自己的喜好来整理、总结和归纳(比如借助其他AI工具做成思维导图之类的),但B站目前还没有提供字幕下载的功能,只有试试其他方法了。
我发现可以有三个思路:
▪️第一种方式比较原始,先下载音频/视频,然后使用市面上的一些AI工具来将音视频转文稿,再进行分析总结并对内容进行结构化的展示。
▪️第二种方式则省去了下载音视频的过程,直接下载字幕文件,有一些网站支持这种方式,然后将字幕文件发给AI工具来帮我们整理。
▪️第三种方式则是一步到位,看看有没有那种——提供音视频链接后,直接帮我们进行内容整理和分析的工具。
我们来一个个试试。
音视频转文字工具,该选什么?
作为了解了许多AI工具的打工人,经验告诉我,越是能帮我们省去中间过程的工具,就越不可能免费……
所以,我还是想先试一下能不能白嫖,所以先从比较原始的方式来。
搜到了一个可以免费使用的视频下载网址(https://www.kedou.life/),支持B站、油管和各大视频网站链接的视频下载。
在“输入链接”-“选择音频”-“直接下载”-等待提取进度完成后,即可下载保存。
然后我选了两个市面上比较知名的音视频转文字的工具来进行对比,一个是阿里通义,一个是飞书妙记。
两款软件都有免费的额度,通义有10小时的额度(同时可以每天登录领取10小时额度);飞书妙计就要少一点了,每个月有5个小时的额度。
让我们先来试试通义的模型。
进入通义首页,点击左侧的“发现”按钮后,即可在右侧看到“音视频速读”的选项,点进去便可开始上传文件。
在左侧选好上传文件后,便可以接着选好“音视频语言”、“翻译”、“区分代言人”等设置,接着便可以点击确认等待上传与解析。
我上传的音频文件不大,20多M,大概等待2分钟左右便解析成功了,然后便可以点击文件进入解析页面。
进入后就可以看到具体的文字稿、章节速览、发言总结等等常见的功能。章节速览就比B站自带的工具要详细很多,可以更准确地捕捉到重要的观点和例子的说明。
另外一点比较好的则是,可以自行对重要的信息内容进行标记、摘录,方便自己消化吸收和整理,这边就有助于大家更好地形成自己的知识体系和系统。
有一点想要强调的是,虽然AI在整理总结这一块非常厉害,但培养自己的关注侧重点和思维逻辑链条,依旧非常重要。如果对AI的内容全盘接受,自己也会更加被动。
在右上角的导出这里,大家则可以根据自己的需要,整理出自己想要的内容。
下面我们来试试飞书妙记:
飞书妙记的界面也比较简洁,以文字为主要内容呈现,左下角可以看到自己剩下的时长,点击右上角就可以上传文档。
上传后等待几分钟,就能够看到文稿啦。不过虽然也有总结、章节纪要等内容,但它对文字内容自主整理的空间就没有通义那么多了。毕竟飞书妙记主要还是飞书会议延伸出来的一个应用。
总的来说,下载视频后转文稿虽然麻烦一点,但它的可操作空间还是挺大的,你也可以用AI大模型来分析这些文稿,同时也基本上是免费的(如果不涉及大量内容整理的话)。
下载字幕+生成结构化内容与PPT
接下来,我们就来试试第二种思路,直接下载字幕文件,然后将字幕文件发给通用的AI大模型来帮我们转化为结构化的内容。
上面提到的下载视频的网站,我使用的时候意外发现它还支持字幕和弹幕下载,各大主流视频平台的字幕、弹幕都支持下载,这也太方便了。
同样的,我们直接输入链接,对字幕进行下载。
下载的文档是TXT格式,很方便给到各大AI对话模型进行进一步的整理,我们就分别试试Deepseek、豆包、Gemini的生成结果。提示词:
这是一个视频的完整字幕文件,请帮我梳理这个视频中最重要的观点和内容结构。输出请包括以下内容:
1.视频的主题概要(用1-2句话总结)
2.主要观点梳理(列出关键观点,按出现顺序,内容稍作凝练,但不要太简洁)
3.每个观点下的支撑内容或例子(简要说明)
4.如果有明显的结构分段,请标明每段的时间节点和内容主题。
5.根据梳理的内容帮我制作一个排版优美的HTML网页
先来看看Deepseek的效果:
Deepseek的生成结果略微有点粗糙,虽然有观点的梳理和总结,但总体的内容并不够细致,只是简单做了归纳总结。
下面再看看豆包:
整体视觉效果和内容层次都还不错诶!
接下来我们来试试最近大出风头的谷歌Gemini 2.5 Pro:
说实话,Gemini的整理可以说是相当细致的了,篇幅虽然较长,但文字内容层次感是比较清晰的,想要仔细研读或是粗读都是可以的。
为了更结构化的展示这些信息,我想再试试目前市面上的工具来让文本转化为PPT。
今年的各家Agent都很火,Manus、扣子空间、Genspark都是前段时间很有讨论度的几个智能体产品,今天正好来验证一下它们做PPT的能力。
前两天听说Genspark刚刚上线了新的“AI幻灯片”功能,准备试试。提示词跟上面的一样,不过就是多加一句“PPT要求,风格简约、内容层次要清晰”就可以了。
来看看效果:
哇!相当的惊艳!没想到现在AI做PPT已经能到80分左右的水准了,只需要再微调一下信息感觉就很不错了。
(好用确实好用,不过就是生成到一半时,免费的积分用完了,后面的它就不做了,有点哭笑不得……)
再来试试3月份大火的Manus的效果吧:
居然就仅仅是背景底色+文本,而且连认真的排版都没有……Manus这就有点让人失望了啊……
再试试这几天人人都在求邀请码的扣子空间,希望它能发挥得好一点:
嗯……怎么说呢,就是一股很明显的“模版味”,就是套用的一些常见但很普通的PPT模版,连内容的格式都是一致的。
从Manus和扣子空间的生成情况来看,目前的许多智能体还没有做好像生成PPT这种基本功能的优化。
如果连这种打工人日常常用的基本需求都没有做好,我的确很难相信它能够很好地完成更复杂的任务。
音视频链接直接进行信息整理
接下来,我们再试一下第三种思路,看有没有那种——提供音视频链接后,直接帮我们进行内容整理和分析的工具。
搜索了一些工具之后,发现是有的!BibiGPT就能够完成这项任务。
进入页面后,可以选择直接输入网址,也可以选择上传音视频文件,右下角可以看到,这个工具只有120分钟的免费时长,所以想体验的话可以先尝试不那么长的视频内容。
我分析了老蒋这个视频就只剩60分钟了……
先来直接看看效果:
第一眼感觉中规中矩,常见的信息整理和归纳的功能都有。
我又试了下它自带的对话AI和思维导图功能,对话的能力可以使用,但还达不到市面上AI大模型的智能程度;思维导图感觉内容层级不够,导致信息比较密集。
总的来说,这样直接贴链接的方式的确很方便,不需要额外的下载或者其他操作,但一方面是这种工具通常都要付费,另一方面则是它自带的AI整理和对话功能可能因其模型能力而受限。
写在最后
经历了上述的探索过程和对AI工具的实际使用,我发现自己对于信息焦虑的问题,有了一定程度上的缓解,的确有一些工具能够帮助到我。
但与此同时又有另外一个问题冒了出来,虽然我的确能够通过一些工具来帮助我更快速地整理和吸收信息,可是这个学习新工具的过程也是有成本的。
并且,想要找到自己觉得合适和顺手的工具,可能也会因人而异,都需要一个探索和磨合的过程。
也许,这种纠结又矛盾的感受,会是AI时代下很普遍的一种状况吧!
希望这篇测评能给你一些启发!
以下是本期提示词整理:
这是一个视频的完整字幕文件,请帮我梳理这个视频中最重要的观点和内容结构。输出请包括以下内容:
1.视频的主题概要(用1-2句话总结)
2.主要观点梳理(列出关键观点,按出现顺序,内容稍作凝练,但不要太简洁)
3.每个观点下的支撑内容或例子(简要说明)
4.如果有明显的结构分段,请标明每段的时间节点和内容主题。
5.根据梳理的内容帮我制作一个排版优美的HTML网页
关注ChooseAI,和我们一起探索AI时代!