WWDC2024前夕,苹果Siri等重点AI更新再被大爆料

果粉Fans 2024-05-30 23:50:16

据外媒最新消息,在苹果的年度WWDC之前,该公司内部正在测试各种新的与人工智能相关的功能,该公司的AI改进将着重于给最终用户带来更实际的功能。

在苹果的操作系统的预发布版本中,该公司一直在开发一种全新的通知摘要功能。这个功能与Siri相关联,这意味着用户将能够通过虚拟助手请求和接收他们最近通知的概述。

预计Siri将通过一种新的智能响应框架和苹果的设备上的LLM获得显著的响应生成能力更新。在生成回复和摘要时,Siri将能够考虑人物和公司、日历事件、位置、日期等实体信息。

这意味着Siri将能够在设备上回答查询、创建长文章的摘要,或在更新的Notes或Voice Memos应用中转录音频。所有这些都将通过使用Ajax LLM或云处理来完成更复杂的任务。

此外,据称苹果还一直在测试增强和“更自然”的语音,以及文本转语音的改进,这将最终带来显著更好的用户体验。

苹果还一直在研究Siri的跨设备媒体和电视控制功能。这个功能将允许用户例如使用他们的Apple Watch上的Siri来在另一个设备上播放音乐,尽管该功能预计要到2024年后期才能实现。

公司决定将人工智能嵌入到其核心系统应用程序中,以实现不同的用例和任务。其中一个值得注意的改进领域与照片编辑有关。

苹果开发了用于改进图像编辑的生成AI软件

iOS 18和macOS 15预计将为Photos等应用程序带来支持人工智能的图像编辑选项。在内部,苹果已经开发了一种新的“移除”功能,允许用户通过使用生成AI软件从图像中移除物体。

在苹果的测试环境中,可以通过人工智能生成图像,然后通过iMessage发送出去。有迹象表明,公司计划将类似功能引入其操作系统的最终用户。

这一信息与另一份报告一致,该报告称用户将能够使用人工智能生成独特的表情符号,尽管还有其他关于图像生成功能的可能性。

据知情人士透露,在苹果的Notes应用程序的预发布版本中,还包含有关一个生成工具的引用,不过目前尚不清楚该工具是生成文本还是图像。

Notes将获得AI支持的转录和摘要功能,以及Math Notes

苹果为其内置的Notes应用程序准备了重大改进,将首次亮相iOS 18和macOS 15。更新后的Notes将获得应用内音频录制、音频转录和LLM支持的摘要功能。

音频录制、转录和基于文本的摘要将全部在一个笔记中提供,以及用户选择添加的任何其他内容。这意味着一张单独的笔记可以包含一次整个讲座或会议的录音,完整的白板图片和文本。

这些功能将使Notes成为一个真正的强大工具,使其成为学生和商务专业人士的首选应用程序。添加音频转录和摘要功能还将使苹果的Notes应用程序能够更好地竞争微软的OneNote或Otter等竞争产品。

虽然应用级别的音频录制、基于AI的音频转录和摘要功能将极大改进Notes应用程序,但这些并不是苹果一直在努力改进的唯一方面。

Math Notes – 通过使用AI创建图表和解方程

Notes应用将全新推出Math Notes,这将带来对正确数学符号的支持,并实现与苹果的新GreyParrot计算器应用的集成。

知情人士透露,Math Notes将允许该应用程序识别数学方程的文本并为其提供解决方案。目前还在开发支持绘制表达式的功能,这意味着我们可能会在Notes中看到类似于macOS上的Grapher应用程序的功能。

另外,在Notes中,用户将获得一个选项,以类似于苹果当前在iOS上提供的预测文本或行内完成的方式自动完成他们的数学方程——这也预计将在今年晚些时候传至visionOS。

Apple的visionOS还将与苹果的Transformer LM实现更好的集成,后者是一种提供用户输入时建议的预测文本模型。该操作系统还预计将获得重新设计的Voice Commands UI,这表明苹果非常重视与输入相关的改进。

该公司还试图通过使用所谓的“智能回复”来改善用户输入,这将在Messages、Mail和Siri中提供。这将允许用户使用苹果设备上的Ajax LLM即时生成基本的文本回复来回复消息或电子邮件。

苹果的AI与Google Gemini和其他第三方产品的竞争

人工智能已经进入几乎每个应用程序和设备。开放AI的ChatGPT和Google的Gemini等以人工智能为重点的产品在总体上的受欢迎程度也大大增加。

在5月14日的年度Google I/O开发者大会上,谷歌展示了人工智能的一个有趣用例——用户可以以视频形式提出问题,并获得人工智能生成的回答或建议。

该公司还宣布了Google Veo——一种可以通过人工智能生成视频的软件,OpenAI也拥有自己的视频生成模型Sora。

苹果的Project Greymatter和Ajax LLM无法生成或处理视频,这意味着该公司的软件无法回答关于消费类产品的复杂视频问题。这很可能是苹果寻求与谷歌和OpenAI等公司合作达成许可协议并为其用户群体提供更多功能的原因所在。

相对于Humane AI Pin或Rabbit R1等实体AI产品,苹果的AI项目具有重要优势,因为它们在用户已经拥有的设备上运行。这意味着用户不需要购买特殊的AI设备即可享受人工智能的好处。

Humane的AI Pin和Rabbit R1也被普遍认为是未完成或部分功能的产品,后者甚至被证实不过是一个定制的Android应用程序。

苹果的AIGC相关重点更新将于北京时间6月11日凌晨一点的WWDC 2024上宣布,让我们拭目以待。

0 阅读:1

果粉Fans

简介:爱科技,爱生活,不爱工作