DeepSeek的火爆,伴随而来的是人工智能的热潮,甚至在我们公司也引起了不小的关注。
上周,我为同事们举办了一次关于人工智能入门的分享会,思考过后,我觉得内容非常适合那些对这方面不太了解的朋友们。
于是,我决定将这次分享整理成文章,希望能帮助大家更好地认识到人工智能。
如果你对AI的世界依然感到迷茫,不妨仔细读一读这篇文章。
这将是一次有益的导航,有助于你建立起初步的认知。
不仅会介绍到AI的技术原理、创造内容的本质,还会聊聊它能完成的工作以及使用一些实用工具的方法。
其实,深究人工智能的背后,不禁让人思考大语言模型为何在当下的时代蓬勃发展。
这一切得从三方面来剖析。
首先是计算方法的突破,2017年Google团队推出的Transformer架构,为人工智能打开了一扇新窗。
这种结构能够通过神经网络学习语言中的规律,进而实现文本的理解与生成。
这相当于给予了计算机理解语言的能力,使其能够识别和处理更复杂的语义关系,最重要的是,它能够捕捉到长距离的语义关联,像个“超级读者”!另一方面,生成对抗网络的技术进步,也为我们带来了新的变化。
2014年首次提出的这一技术,实现了生成器与判别器之间的对抗训练,进而让机器能够生成逼真的图像和视频。
这样的技术让一定的创造力被计算机所具备,产生了许多独特的内容。
在这样的时代背景下,AI的出现在某种程度上是必然的。
其次,随着互联网的迅猛发展,我们积累了海量的信息。
在信息化的浪潮下,尤其是近年来,网络上涌现出大量优质内容,数据的不断累积为AI提供了丰沛的“学习资源”。
想象一下,过去几千年所产生的知识,可能都不及这二十年制造的信息量!人工智能的学习过程,实际上就是从这些海量信息中寻找规律,从而模仿人类的创作。
因此无论是语言的结构还是视觉的特征,AI都能从中提炼出潜在的规律。
不仅如此,只有拥有足够高质量的信息,AI才能获取到与人类文本之间的相似性。
再者,硬件性能的飞速成长也是我们必须提到的。
从过去计算能力较低的显卡,到如今如NVIDIAH100这样的强大设备,AI的训练不再是需要几年的时间,而是几周,甚至几天。
技术的飞跃使得昂贵的计算变得更加普及与平民化。
分布式计算技术的发展,更是让谷歌TPUv4的每秒运算能力达到2.3exaflops!这样强大的基础支撑,为人工智能的全面崛起提供了充足的动力。
那么,为什么人工智能能够创造出内容呢?以DeepSeek为例,它可以看作是我们生活中那种读过无数书籍、知识渊博的朋友。
人工智能的工作方式就是它通过海量的知识进行“阅读”,并在此过程中不断建立各种知识之间的关联。
说到这里,值得关注的是,支持这种能力的核心技术正是我们前面提到的Transformer架构。
它的“注意力机制”让语言的理解变得更加高效,就好比一位“超级读者”,能够迅速锁定文本中的关键信息。
DeepSeek在不断发展的过程中,“阅读”了与人类积累的海量知识。
在这段过程中,它从严肃的维基百科到富有文学感的作品,甚至包括学术论文与专业技术文档,通过逐步预测句子中缺失的词,来掌握语言的规律。
理解到某个词后面多半会出现哪个词,AI所做的也仅仅是根据概率最大化的原则进行“猜测”而已。
那它是否真的理解了我们所说的内容呢?答案是否定的。
在某种意义上,人工智能更像一只鹦鹉,模仿人类的表达,而不是通过逻辑推理来回答问题。
它与我们在影视中看到的大智若愚的人工智能有着显著的区别,真正的AGI仍然遥不可及。
既然人工智能如此有限,我们自然会对它能够做什么产生好奇。
当前,人工智能能够做的事情大致可以分为几类。
首先是一些基础能力,像文本生成、图片生成、视频生成和音频生成等。
必须指出,尽管DeepSeek的表现令人惊叹,很多人对它寄予了过多的期望,事实上AI的目前能力主要体现在内容创作上,仅此而已。
借用一下我的经验,我创建过一段《舌尖上的中国》风格的搞怪视频。
整个制作流程中,我先利用DeepSeek生成脚本和具体文案,接着使用Whisk生成静态图片,然后通过可灵将静态图片转化为视频画面,最后借助剪映的AI配音功能合成完整视频。
基于这些基础能力,人工智能的另一个发展方向则是它的进阶能力。
我们看到市面上涌现出更多AI工具,比如豆包聊天机器人、秘塔AI搜索、Manus等,它们在某一方面得到了真实的强化。
Manus和秘塔AI搜索可以理解为AI智能体,这些系统能够感知环境、作出决策并采取行动,目的就是完成一定的目标。
但现代的AI智能体的定义已经有所拓展,像在豆包上各种不同的聊天机器人都被统称为智能体。
不断发展后,这些智能体具备了输入、处理和输出的多重能力,重心则在于对信息的处理与反应,不同的智能体依靠的技术手段和复杂程度则各有不同。
以豆包的聊天机器人为例,它是初级智能体,能够根据设定的指令作出相应的回应。
而Manus这类“通用型”的人工智能智能体就更加高阶,能为我们解决多种复杂问题。
当用户告诉它当前需要完成的任务时,它能够自主规划,自动浏览网页并调用多种工具来达到目的,无需人工干预。
而它的功能范围也很广泛,行业趋势分析、旅游攻略的制定,甚至小型游戏的开发都不在话下。
随着技术不断进步,这些智能体将具备更高级的特质,包括更强的自主性、更广泛的感知能力和复杂的决策能力。
无疑,AIAgent便是AI发展的主要趋势之一,它们正在弥合强大AI能力与实际应用之间的差距。
对于普通用户而言,AI不再是一个复杂的工具,而是一个真正理解和执行任务的助手。
对企业来说,AIAgent将有效降低人工智能的应用门槛,使得更多行业和场景能够切实享受到人工智能带来的效率提升。
大家或许会觉得与人工智能的互动特别重要。
虽然很多人对其要求较高,但实际上,人工智能并没有现实世界的体验。
可以把AI看成是一位全知的实习生:什么都懂,但做不到。
因此,与其沟通时需要掌握一些技巧。
首先,提示词的编写至关重要,清晰且具体的指令将直接影响其生成内容的质量。
要明确表达你的需求,如“撰写一篇关于火星探索的科普文章”,这样的指令将帮助人工智能理解所需内容。
有三个类型的提示词方式,分别是任务型、角色型和结构化的。
任务型的就是明确指派任务,比如“翻译以下内容”,适合目标清楚的情况;角色型则是设定某种角色指导AI,例如“假设您是营养专家,设计一周的减脂食谱”,增强专业性;而结构化的则更加复杂,是利用模板提供指令,提高理解效率。
以CRISPE原则为例,按照清晰度、角色、步骤、示例、反馈的规范进行指令的设定能够进一步帮助提升沟通的效率。
处理复杂任务时,人工智能有时会“偷懒”,这时候可以考虑逐步指导。
比如要求AI撰写一篇“远程办公的未来趋势”的文章,建议将任务分解成几步,以确保最终结果的质量。
此外,持续提问也是至关重要的,在与AI的互动中,尽量别期待一次性完成所有内容,不妨把它当作一位优秀的实习生,给予引导与反馈,定期优化生成的内容。
不过,用户在使用人工智能时应当保持警惕。
正如DeepSeek的R1版本,其幻觉率可能高达14%。
人工智能的“幻觉”是指有时其会编造看似合理但实际上错误的信息。
有些情况下,比如AI可能会依据错误的引导信息来虚构文章,因此在信息需求过于复杂的场合,应当十分小心。
人机互动的核心在于双方的信息交互,用户必须明确其预估的范围。
同时在互动时最好不要ば信任它的所有建议,例如在健康问题上,AI的判断肯定不应代替专业医生的意见。
结合这些看法,我们不妨重新审视人工智能的未来。
DeepSeek的崛起不仅是技术的成功,更是我们人类认知进化的一部分。
面对人工智能的快速发展,无论我们处在什么时候,始终要保持好奇、批判的心态。
这样的认知不仅帮助我们解码当下,还能为我们的未来打下基础,助力我们在更广泛的领域内创造出更多可能