苹果在WWDC24开发者大会宣布与OpenAI全方位展开合作,未来会将ChatGPT集成到 iOS、iPadOS 和 macOS 的体验中,公司还介绍了全新的“苹果智能”技术。不过其股价在会后震荡走低,市值一夜蒸发580亿美元。
成立于深圳、后将总部迁至洛杉矶的AI公司HeyGen,正逼走中国风投,强制要求红杉中国、真格等机构把股份卖给美国投资者。
端午假期间,国内AI行业还有哪些热点值得关注呢?让乌鸦君带你一起看看吧。
/ 01 / 大模型
1)腾讯推全新图生视频模型Follow-Your-Pose-v2
腾讯混元团队联合中山大学、香港科技大学推出图生视频模型"Follow-Your-Pose-v2",实现了多人视频动作生成、强泛化能力和正确处理人物遮挡等亮点。
2)清华蚂蚁推出纯MLP架构模型,长短程时序预测大幅提升
蚂蚁同清华联合推出一种纯MLP架构的模型TimeMixer,在时序预测上的性能和效能两方面全面超越了Transformer模型。
他们结合对时序趋势周期特性的分解以及多尺度混合的设计模式,不仅在长短程预测性能上大幅提升,而且基于纯MLP架构实现了接近于线性模型的极高效率。
3)极佳科技联合清华大学发布Sora级视频生成大模型视界一粟 YiSu
极佳科技联合清华大学自动化系发布端侧可用的生成大模型“视界一粟YiSu”。YiSu拥有模型原生的16秒时长,并可生成至1分钟以上,同时还拥有超大运动、超强表现力、懂物理世界等特点。据悉,YiSu模型成本更低、速度更快、端侧可用。
/ 02 / AI应用
1)苹果WWDC24:整合GPT-4o、Siri全面进化;会后市值一夜蒸发4213亿元
苹果在WWDC24开发者大会上宣布,由GPT-4o提供支持的ChatGPT集成将于今年晚些时候登陆iOS、iPadOS和macOS。在Siri和写作工具中访问ChatGPT时,OpenAI不会存储请求,并且用户的IP地址会被遮盖。
此外,苹果宣布“苹果智能”(Apple Intelligence)套件,仅支持两款iPhone。该套件能够理解和创建语言和图像,同时AI指令可以跨应用运行。目前看来“苹果智能”套件只能在A17 Pro(iPhone 15 Pro/Pro Max可用)上跑得动,而M系芯片的iPad都能跑得动。
截至美东时间周一收盘,苹果跌1.91%,市值一夜蒸发580亿美元(约合人民币4213亿元),总市值2.961万亿美元。
2)马斯克怒斥苹果接入ChatGPT:真敢集成就在全公司禁用
苹果宣布将在iOS18中接入ChatGPT,被马斯克认为是极不安全的做法。马斯克扬言,如果苹果敢把ChatGPT集成到系统级别,自己所有的公司都将禁用苹果设备。不仅是员工,访客的苹果设备也会被检查,然后在法拉第笼(可屏蔽信号)中暂存。
马斯克还发布了一张梗图表达对此事的观点。
3)粉笔将于8月推出自研AI智能老师
粉笔在港交所公告称将于8月推出自研AI智能老师,为粉笔线上平台提供的AI学习工具之一,将率先应用于其国家或省级招录类及资格证考试系统班,成为其重要组成部分。
4)OpenAI升级GPT语音,使其能够以不同角色的声音说话
OpenAI表示将在“未来几周内”推出ChatGPT的语音功能,允许用户使用AI生成的声音和声音风格与聊天机器人进行交互,目前有四种预设声音,用户可以指示AI聊天机器人使用任何语音实时做出响应。
5)Adobe修订服务条款,明确不会用客户作品进行AI训练
Adobe宣布重新修订服务条款,澄清不会用客户作品进行AI训练,目的是赢回用户的信任。这一变化是在一周前的用户强烈抗议后宣布的。
/ 03 / 投融资情报
1)AI公司HeyGen正逼走中国风投,强制要求红杉中国、真格等机构把股份卖给美国投资者
成立于深圳、后将总部迁至洛杉矶的生成式AI初创公司HeyGen,要求其中国投资者IDG资本、风投、红杉中国、真格基金(ZhenFund)把股权卖给美国投资者。
知情人士称,美国投资者和HeyGen创始人徐卓(Joshua Xu)希望“整顿股权结构表(cap table)”,即投资者名单,因为美国方面正在加强对中国科技集团和跨境投资的审查。今年3月,HeyGen完成了硅谷Benchmark领投的一轮融资,使得红杉中国等中国投资者大幅减少股份。
对此,红杉中国和HeyGen拒绝置评。Benchmark、IDG资本、百度风投和真格基金没有回应置评请求。
2)全球生成式AI的种子轮投资额一季度暴跌76%
根据PitchBook披露的数据,今年第一季度,是自2022年11月ChatGPT发布以来,全球在AI赛道种子前轮和种子轮的风险投资交易总额最低、总交易笔数最低的一个季度。
总交易额连续两个季度下滑,从2023年三季度的峰值5.177亿美元,降至1.229亿美元,暴跌76%。总交易笔数连续三个季度下滑,从2023年二季度的峰值113笔,降至34笔,暴跌70%。
3)Seven AI获3600 万美元融资
Seven AI是一家通过AI帮助企业增强网络攻击防御能力的初创公司。本轮融资由Greylock领投,CRV 和 Spark Capital 也参与了 Seven AI 的融资。
4)Tektonic AI获1000万美元种子轮融资
Tektonic AI为企业运营提供GenAI智能体,使企业能够消除重复且效率低下的任务。本轮融资由Madrona和Point72 Ventures领投。
/ 04 / AI基础设施
1)港大北航等1bit大模型引热议,作者亲解
IEEE Spectrum专栏中一种名为BiLLM的训练后量化(PTQ)方法爆火,它使用1bit来近似网络中的大多数参数,使用2bit来表示一些对性能最有影响的权重。有媒体联系作者进行解读:
研究人员通过观察得出,大语言模型的Hessian矩阵表现出极端的长尾分布特性,其次大语言模型中的权重密度遵循不均匀的钟形分布形式。上述观察表明大多数权重在LLM当中是冗余的,而少部分权重发挥着极其重要的作用;同时,在极端的二值化压缩场景下,这种非均匀钟形分布会产生更大的量化误差。
对此,研究人员对少部分显著权重和大部分非显著权重分别提出了二阶残差逼近和最优钟形分组方法进行量化,在1.1bit的权重下首次实现了LLM的性能保证。
2)谷歌推创新框架AGREE,可增强大模型生成内容准确性
谷歌研究院推出名为AGREE的创新框架,这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础,并提供相应的引用。研究人员在Llama-2-13b等知名大模型上进行实验,结果显示AGREE在提升内容回答准确性和引用性方面表现突出。
3)上交港中文新框架5秒完成3D生成,合成数据集已开源
来自上海交大、香港中文大学等团队推出Bootstrap3D框架,结合微调的具备3D感知能力的多模态大模型。这个框架能够自动生成任意数量的高质量的多视角图片数据,助力多视图扩散模型的训练。结果表明,新的合成数据能够显著提高现有3D生成模型的生成物体的美学质量和文本prompt的控制能力。
目前,Bootstrap3D的数据集已经全面开源。