欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、苹果发布iOS18.2正式版:Siri接入ChatGPT
苹果公司正式发布了iOS18.2、iPadOS18.2和macOS Sequoia15.2,特别是iOS18.2引入的新功能Apple Intelligence备受关注。该功能支持iPhone15Pro和iPhone16系列,用户可以创建自定义Genmoji表情,并使用集成的ChatGPT智能语音助手Siri。
【AiBase提要:】
🆕 iOS18.2引入Apple Intelligence,支持自定义Genmoji和图像生成应用Playground。
🤖 Siri集成ChatGPT,用户可在无账户情况下免费获取智能助手服务。
🌍 扩展语言支持,未来将增加多种语言,包括中文和多种英语方言。
2、谷歌Gemini2.0版正式发布:速度比Gemini1.5Pro 快两倍
谷歌近日发布了 Gemini2.0Flash AI 模型,处理速度比前代产品Gemini1.5Pro快两倍,并扩展了多模态功能。新模型支持实时处理音频和视频流,集成图像生成功能,增强了全球可访问性。Gemini2.0Flash 也在软件工程领域表现突出,提供 AI 驱动的代码辅助工具,进一步推动 AI 技术发展。
【AiBase 提要:】
🚀 Gemini2.0Flash 处理速度是前代的两倍,性能显著提升。
🎥 新增多模态实时 API,支持音频和视频流的处理。
🌐 原生图像生成功能集成,允许通过文本创建和修改图像。
官方介绍:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash
3、百度文库上线「专业PPT生成」AI功能:支持一键生成高质量PPT
百度文库最近推出了「专业PPT生成」AI功能,旨在简化用户创建高质量PPT的过程。通过AI技术,用户只需输入关键词或主题,便可一键生成内容明确、结构清晰的PPT。这项功能不仅提高了制作效率,还提升了演示文稿的专业度,特别适合职场人士展示工作成果和未来规划。
【AiBase提要:】
💡 该功能通过AI技术,实现一键生成专业PPT,简化制作流程。
📊 适合年终总结、演讲汇报等多种场景,帮助用户清晰展示工作成果。
🎨 新版式设计提升PPT视觉效果,使演示更具专业性和说服力。
4、Midjourney 推出多人协作的世界构建工具 “Patchwork”支持100人同一画布操作
Midjourney 推出了一个名为“Patchwork”的新工具,旨在为用户提供一个无限的白色画布,以便进行创意合作和世界构建。用户可以通过连接 Discord 和 Google 账户来访问该工具,并在一个画布上与最多100名其他用户实时协作。Patchwork 允许用户添加角色、事件和场景元素,并生成新的图像和描述。
【AiBase提要:】
🌟 Patchwork 提供一个无限的画布,支持用户实时协作构建故事和世界。
🤝 该工具允许最多100名用户共同创作,添加多种角色、事件和场景元素。
🎥 Midjourney 将推出个性化模型和视频生成能力,持续扩展功能和应用场景。
详情链接:https://patchwork.midjourney.com/
5、ChatGPT宕机是苹果的锅?OpenAI紧急抢修,目前已恢复访问
OpenAI的ChatGPT和Sora在全球范围内遭遇大规模宕机,用户无法访问服务。问题可能源于苹果最新软件更新,导致Siri与ChatGPT的集成给OpenAI服务器带来巨大负载。此次宕机持续超过三个小时,影响了数百万用户,凸显了AI服务对算力的需求及流量激增带来的挑战。虽然服务已恢复,但此事件引发了对OpenAI服务稳定性的担忧。
【AiBase提要:】
⚠️ OpenAI的ChatGPT和Sora发生全球范围的宕机,用户无法正常访问。
📱 苹果最新软件更新将ChatGPT集成到Siri中,导致OpenAI服务器负载激增。
⏳ 此次宕机事件持续超过三个小时,影响了数百万依赖OpenAI服务的用户。
6、AI音频新技术MMAudio:输入视频或文本可自动给视频配音效
MMAudio是一项由伊利诺伊大学、Sony AI及Sony集团联合推出的新技术,旨在实现视频到音频的高质量合成。该技术通过多模态联合训练,能够利用视频和文本输入生成同步音频,拓展了音频生成的应用场景。
【AiBase提要:】
🌟 MMAudio技术通过多模态联合训练,实现视频与音频的高质量合成。
📦 用户可通过简单安装步骤,在Ubuntu上使用MMAudio进行音频生成。
⚠️ 当前版本存在一些局限性,但研究团队正致力于通过增加训练数据来改善性能。
详情链接:https://huggingface.co/spaces/hkchengrex/MMAudio
7、苹果与博通联手研发 AI 服务器处理器,计划2026年投产
苹果公司正在与博通合作,研发一款定制的服务器处理器,旨在支持其操作系统中的AI服务。该项目代号为“Baltra”,预计将在2026年进入生产阶段。尽管目前关于该项目的具体细节尚不明确,但苹果一直致力于设计基于Arm架构的芯片,开发AI专用芯片并不令人意外。
【AiBase提要:】
🌟 苹果与博通合作开发 AI 处理器,项目代号为 “Baltra”。
🖥️ 预计该处理器将在2026年开始生产,支持苹果的 AI 服务。
🔍 目前项目细节尚未披露,苹果对新产品一向保持神秘。
8、谷歌推出 AI 编码助手 “Jules”,自动修复软件漏洞并加速开发流程
谷歌近日推出了其人工智能编码助手Jules,标志着在自动化编程任务方面的重大进展。Jules基于Gemini2.0平台,能够在开发者休息时自主修复软件漏洞并生成代码更改。该系统与GitHub无缝集成,分析复杂代码库并实施跨多个文件的修复,旨在提高开发效率并降低成本。
【AiBase提要:】
🌟 Jules是谷歌最新推出的AI编码助手,能够自主修复软件漏洞并生成代码更改。
🔧 该系统与GitHub无缝集成,分析复杂代码库并在多个文件中同时实施修复。
📅 Jules将于2025年初向更多用户开放,旨在提高开发效率并降低成本。
详情链接:https://labs.google.com/jules/
9、谷歌推出新一代 Trillium AI 芯片,性能提升四倍
谷歌最近发布的Trillium人工智能加速器芯片标志着AI技术的一次重大突破。该芯片在Gemini2.0模型的训练中展现出四倍的性能提升,同时显著降低了能耗,可能会重塑AI开发的经济模型。谷歌已在其超级计算机架构中部署超过10万颗Trillium芯片,显示出其在AI基础设施领域的雄心。
【AiBase提要:】
🌟 Trillium芯片性能提升四倍,显著降低能耗,推动AI训练效率。
💰 每美元训练性能提升2.5倍,可能重塑AI开发经济模型。
🔗 谷歌已部署超过10万颗Trillium芯片,构建全球最强AI超级计算机。
详情链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga
10、Adobe 进军 AI 视频生成!Firefly 平台内容生成破160亿,视频创作即将迈入“付费时代”
Adobe 正在积极扩展其人工智能领域,尤其是在视频生成方面。基于 Firefly AI 平台的成功,Adobe 宣布将推出新的高端视频生成功能,预计将于明年初上线。该功能目前处于测试阶段,已推动 Premiere Pro 用户量显著增长。
【AiBase提要:】
🎥 Adobe 将于明年初推出高端视频生成功能,现阶段已在测试中,用户增长显著。
📈 Firefly 平台已生成超过160亿个内容,推动了 Adobe 产品的广泛应用和市场扩展。
💼 Adobe 计划通过教育项目帮助3000万学习者提升 AI 素养和数字营销技能。
11、OpenAI Sora涉嫌秘密使用游戏视频训练 引发版权争议
OpenAI最近发布的视频生成AI模型Sora引发了广泛关注,但其训练数据可能包含大量未经授权的游戏视频和直播内容,给公司带来了法律风险。研究显示,Sora能生成多种风格的视频,甚至能够模仿知名主播的角色。知识产权律师对此表示担忧,认为未经授权使用游戏内容训练AI模型可能构成版权侵犯。
【AiBase提要:】
⚖️ Sora的训练数据可能包含未经授权的游戏视频,带来法律风险。
🎥 Sora能够生成多种游戏风格的视频,并模仿知名主播角色。
📜 知识产权法律复杂,个人用户可能因AI生成内容面临侵权风险。
12、公安部曝光AI造谣新犯罪:6人批量发布50万篇引流虚假信息
近日,公安部网安局通报了一起利用人工智能工具制造虚假信息的案件,揭示了网络造谣的新模式。广州警方成功侦破了一个犯罪团伙,抓获6名嫌疑人,该团伙通过注册自媒体账号和使用AI工具批量发布虚假信息,造成了严重的网络污染。
【AiBase提要:】
🛑 犯罪团伙利用AI工具批量发布虚假信息,造成网络污染。
💰 该团伙通过低成本的AI写作工具获取流量收益,成本极低。
⚠️ 专家警示AI技术滥用风险,呼吁加强网络信息秩序的维护。