OpenAI7年安全元老、华人高管官宣离职,或将回国;颜水成卸任昆仑...

智能科技有评论 2024-11-13 14:08:38

要闻提示

1.OpenAI 7年安全元老、华人高管翁荔官宣离职,或将回国

2.著名AI学者、天工智能首席科学家颜水成离开昆仑万维

3.60 秒生成 5 秒 AI 视频,字节自研视频生成模型 Seaweed 开放使用

4.AI 内容博弈:OpenAI 在和新闻机构版权纠纷案中赢得首轮胜利

5.谷歌 DeepMind 研究再登 Nature 封面,隐形水印让 AI 无所遁形

今日头条

OpenAI 7年安全元老、华人高管翁荔官宣离职,或将回国

11 月 9 日,OpenAI 安全系统团队负责人翁荔(Lilian Weng)通过 𝕏 宣布,将于 11 月 15 日离开,结束她在 OpenAI 长达近 7 年的职业生涯。翁荔在离职信中表示,这是一个艰难的选择,并表达了对 OpenAI 团队及其所取得的成就的感情。

翁荔为华人科学家,自加入 OpenAI 以来,曾在多个关键领域做出贡献。她在 2017 年初加入,参与了机器人技术和深度强化学习的研究,并为后来的 GPT-4 以及安全系统的奠定了基础。她领导应用人工智能研究团队,致力于提升 OpenAI API 的实用性和安全性。特别是在 GPT-4 发布后,她主导了 OpenAI 安全系统的愿景,致力于提升 OpenAI API 的实用性和安全性。她表示,团队在模型安全、对抗性以及越狱防御等方面取得了进展,为行业树立了新的标准。

而就在前不久,她还刚刚现身 2024 Bilibili 超级科学晚活动,发表了《 AI 安全与“培养”之道》的主题演讲,引发全网热议。一时之间,翁荔离开后是否会选择回国,也成为了大家关注的重点。(IT之家、量子位)

国内资讯

著名AI学者、天工智能首席科学家颜水成离开昆仑万维

AI科技评论独家获悉,AI领域国际顶尖学者颜水成又有新动态,已经于近日离开昆仑万维。2023年9月1日,昆仑万维正式宣布,颜水成将担任昆仑万维及天工智能首席科学家。颜水成加入昆仑万维之际,昆仑万维曾表示,颜水成将推动公司在新加坡、伦敦和硅谷三地建立2050全球研究中心。

2015年,颜水成进入工业界,担任360集团副总裁、人工智能研究院院长和首席科学家。2019年,他加入依图科技,担任首席技术官。2021年,他返回新加坡加入Sea集团,创立Sea AI Lab,于2023年年初离职。

颜水成加入昆仑万维前,在机器学习、计算机视觉和多媒体等领域有丰富的成果积累。他是新加坡工程院院士,同时当选AAAI Fellow、ACM Fellow、IEEE Fellow和IAPR Fellow,八次入选「汤森路透全球高被引学者」,是中国计算机视觉领域的佼佼者。

他的本科、硕士与博士均就读于北京大学(1995年-2004年),自 2001 年博士期间进入微软亚洲研究院(MSRA)实习、跟随张宏江博士从事人工智能研究以来,持续在该领域投入了多年精力,取得卓越成果。(更多内容请点击独家丨著名AI学者、天工智能首席科学家颜水成离开昆仑万维)

优化短剧爽点生成能力,昆仑万维 SkyReels AI 短剧平台 12 月 10 日在美国上线

11 月 10 日消息,昆仑万维宣布,旗下 AI 短剧平台 SkyReels 将于 12 月 10 日在美国上线。官方介绍称,在剧本生成方面,SkyReels 丰富了爆款创意模板。其中剧本大模型生成能力大幅提升,尤其是优化了短剧的爽点生成能力,当前生成效果平均在人工剧本评级中可达到 A 甚至 S 的评级。在角色生成方面,研发团队增加了 AI 演员库。同时构建了演员属性标签,基于多模态大模型能力,智能帮助用户找到最适合剧本人物的形象。

在视频生成方面,SkyReels 视频生成成功率提升 21%;在 BGM 和 TTS 匹配方面,SkyReels 构建了带情感的演员音色库以及短剧 BGM 库,让匹配精准度提升了 35%。SkyReels 团队表示,实现了 10 分钟可以完成一键从剧本到角色、到分镜生成和完整的两分钟短剧生成。(IT之家)

国内首份关注科技行业 AI 创新自律与治理的白皮书发布,呼吁发展“人本智能”

11 月 10 日消息,联想集团、上海交通大学人工智能研究院、ESG30 等联合撰写的国内首份聚焦科技行业 AI 创新自律与治理的《人本智能:人机共生时代的科技发展观》报告,在第十五届财新峰会 ESG 专场上发布。会上,由财新智库、ESG30、联想集团、上海交大人工智能研究院、腾讯研究院、联合国工发组织联合发起的《人本智能发展与治理倡议》启动。

商汤科技、西门子医疗、平安健康、科大讯飞、蚂蚁数科、天弘基金、第四范式、壁仞科技、小马智行等 25 家企业和机构作为首批成员加入倡议。该倡议旨在推动各行业领军机构共同推动 AI 技术朝着以人为中心、更负责任与更可持续的方向发展。(钛媒体APP)

60 秒生成 5 秒 AI 视频,字节自研视频生成模型 Seaweed 开放使用

字节跳动旗下的 AI 内容平台即梦 AI 宣布,由字节跳动自研的视频生成模型 Seaweed 面向平台用户正式开放。用户登录后,在“视频生成”功能下,视频模型选择“视频 S2.0”即可体验。

9 月底,字节跳动正式宣布向 AI 视频领域进军,发布豆包模型家族的两款视频生成模型 Seaweed 和 Pixeldance,并通过即梦 AI、火山引擎分别面向创作者和企业客户小范围邀测。

本次开放使用的豆包视频生成模型 Seaweed 是该款模型的标准版,60s 能生成时长 5s 的高质量 AI 视频。即梦 AI 官方透露,近期 Seaweed 和 Pixeldance 两款视频生成模型的 Pro 版也将开放使用。Pro 版模型能实现自然连贯的多拍动作与多主体复杂交互,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性;适配电影、电视、电脑、手机等各种设备的比例。(IT之家)

告别“默片”:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频

11 月 8 日消息,智谱技术团队发布并开源最新版本的视频模型 CogVideoX v1.5,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力,I2V 模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。

官方介绍,CogVideoX v1.5 也将同步上线到“清影”平台,并与新推出的 CogSound 音效模型结合,“新清影”将具备如下特性:

质量提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。

超高清分辨率:支持生成 10s、4K、60 帧超高清视频。

可变比例:支持任意比例,从而适应不同的播放场景。

多通道输出:同一指令 / 图片可以一次性生成 4 个视频。

带声效的 AI 视频:新清影可以生成与画面匹配的音效。(IT之家)

消息称百度或推出内置 AI 助手的智能眼镜

日前有消息显示,百度方面或将推出一款内置小度助手的智能眼镜产品,并计划于 11 月 12 日举行的 2024 百度世界大会上进行展示。随后官方宣布,将在此次活动中发布“ AI 新物种”,因此也被外界认为极有可能正是传言中的智能眼镜。

据知情人士透露,小度方面即将推出的这款智能眼镜将内置摄像头、可拍摄照片和视频,并支持基于百度文心基础模型构建的语音交互功能。同时这款产品的成本或将会低于 Ray-Ban Meta 智能眼镜的 299 美元(约合人民币 2139 元),并有望最早于明年年初上市。(三易生活)

快手“可灵 AI”独立应用上线苹果 App Store,支持生成视频与图片

快手公司近期在苹果 App Store 上线了独立的“可灵 AI”应用,进一步加强其在移动端的 AI 内容创作布局。目前,“可灵 AI”已形成了多平台的产品矩阵,包括网页版、App、小程序以及海外版本。根据官方介绍,“可灵 AI”是一款新一代的创意生产力平台,基于快手自主研发的“可灵大模型”与“可图大模型”,为用户提供视频与图片的生成和编辑功能。

目前,“可灵 AI”支持的视频长度分为 5 秒和 10 秒,最长为 10 秒,与同类产品相近。相比之下,抖音的“即梦 AI”提供更多的时长选项,包括 3 秒、6 秒、9 秒和 12 秒,并加入了运镜功能,给用户更大的创作灵活性。(IT之家)

专家:“ AI+量子计算”是未来计算领域重要分支

11 月 9 日消息,欧洲科学院院士、欧洲人文和自然科学院外籍院士金石在重庆介绍,面向未来的计算领域,AI 与量子计算相结合是重要分支,现在已有国家进行布局。“量子计算是运用量子力学原理设计的,人工智能( AI )则是靠学习大量数据资源,量子计算作为一种新范式可解决 AI 资源消耗量大的难题。”

“当前,以量子计算机、量子云平台为基础开展的应用场景探索,逐渐成为业界研究热点。”金石表示,依托量子计算,可为金融科技、大数据、气象预测、生物医药、能源交通等行业提供更高效的解决方案。他以金融领域为例,量子计算能为金融公司开发评估与优化解决方案,对股票资产等进行最佳投资组合优化,同时对期权的风险进行评估。(中新网)

大模型小爱能力升级,多端设备支持“音乐问答”功能

近期,小米官方发文宣布,大模型小爱音乐能力升级,多端设备支持“音乐问答”功能。据介绍,该功能基于 AI 能力升级,支持歌曲信息追问、搜索专业音乐知识等内容。用户将小爱同学大模型升级至最新版本后,可在手机、车载端体验新功能。

小米小爱同学在今年 7 月末迎来大版本更新,全量升级“大模型小爱”,支持自然问答、图片编辑、车外唤醒防御等功能,覆盖手机、平板、电视、音箱、汽车等核心品类设备。,在今年 10 月的小米 15 系列暨小米澎湃 OS 2 新品发布会中,超级小爱正式亮相。全新超级小爱支持帮助用户“记证照”、“记日程”,实现屏幕智能提取,本地存储可删除,号称“复杂流程一步直达,还可跨设备使用”。(IT之家)

权威中文大模型 10 月榜单出炉,商汤“日日新”金牌

近日,中文大模型测评基准 SuperCLUE 发布了《中文大模型基准测评 2024 年 10 月报告》。在这次测评中,商汤的日日新·商量大模型表现出色,总得分位列国内大模型第一梯队,荣获金牌。

此次测评覆盖了 23 个国内大模型,从三个维度进行综合评估:文科、理科和 Hard 附加任务,共涉及 2900 多道题目。商汤 SenseChat5.5 在多个评测任务中均表现优异,尤其在语言理解和安全方面表现突出,同时在逻辑推理和代码学科也表现出色。更值得一提的是,它在 Hard 任务中的精确指令遵循和高阶推理两项任务中均位于国内第一梯队,展现了其强大的复杂推理能力。(新智讯)

国际资讯

AI 内容博弈:OpenAI 在和新闻机构版权纠纷案中赢得首轮胜利

11 月 9 日消息,有报道称 OpenAI 在与 Raw Story 和 AlterNet 的版权纠纷案件中,赢得首轮胜利。

此前,Raw Story、The Intercept 和 AlterNet 三家美国新闻网站起诉微软和 OpenAI 公司,指控其聊天机器人抄袭新闻网站文章用于训练 AI。这些新闻网站均表示,OpenAI 的聊天机器人 ChatGPT(微软的 Copilot 也使用该技术)在训练过程中抄袭了他们网站上的文章,并且在生成内容时没有显示“作者、标题、版权或使用条款信息”。

纽约联邦法官科琳・麦克马洪(Colleen McMahon)驳回了 Raw Story 和 AlterNet 提起的诉讼,理由是原告未能证明其遭受了可认知的伤害。Raw Story 和 AlterNet 提起的诉讼并没有像其他出版物那样,主张 OpenAI 侵犯了他们的版权,而是指控 OpenAI 违反了《数字千年版权法》(DMCA)条款上。法官认为:“ChatGPT 输出来自 [他们] 文章的抄袭内容的可能性似乎很小”,并认为原告主张的不应该是删除版权相关信息,而是应该主张开发 ChatGPT 时调用其内容资源的赔偿。

尽管诉讼被驳回,Raw Story 和 AlterNet 并未打算放弃,其律师马特・托皮克表示,他们有信心通过修订投诉来解决法庭提出的担忧,继续追求合法权益。(IT之家)

黄仁勋:AI 算力集群扩展至 100 万芯片的可能性与未来展望

近期,黄仁勋在接受采访时透露:未来 AI 算力集群将可能扩展到 100 万颗芯片的概念,他表示:“没有任何物理定律能够阻止这一目标的实现。”

黄仁勋提到“超级摩尔定律”,意味着未来 AI 的计算能力将以每年翻两到三倍的速度增长,远超传统摩尔定律所描述的每两年翻倍。这一突破不仅将在硬件上引发革命性的变化,更可能在算法和应用层面带来颠覆性影响。

黄仁勋强调了软硬件协同设计的重要性。他认为在 AI 的发展历程中,单一的技术突破已难以满足日益增长的算力需求,协同设计将成为关键。一方面,机器学习和 AI 的发展已经显著改变了我们的计算模式,另一方面,数据中心的设计也需要进行全面的创新与优化。黄仁勋也提到了英伟达在与 xAI 合作中取得的进展,仅用 19 天就完成了 10 万卡 H100 超级集群的建设。

面对资本、能源和供应链等挑战,黄仁勋坚信这些挑战都是可以克服的。再过两三年,利用 AI 产生的每一项科学突破和技术进展,都将以 AI 为核心,这是未来科技发展的趋势所在。(搜狐网)

谷歌 Gemini 2.0 或将在不久后发布,具备更快响应速度

据报道,谷歌正计划发布旗下大语言模型 Gemini 的2.0版本更新。据悉,已经有用户在AI 模型选择界面中看到了标记为 Gemini 2.0 的新模型,并进行了初步测试。和当前的 Gemini 1.5 Pro 版本相比,Gemini 2.0 模型具备更快的响应速度。但该模型似乎尚未完全成熟,初步报告指出它未能通过基本的“草莓测试”,而其他模型则轻松通过。不过谷歌目前并未对此消息发表回应,具体发布日期尚未确定。(品玩快讯)

哈佛全新类 ChatGPT 癌症诊断 AI 登上 Nature,准确率最高 96%

近日,来自哈佛医学院等机构的科学家们开发了一种名为 CHIEF(Clinical Histopathology Imaging Evaluation Foundation,临床组织病理学成像评估基础)的多功能 AI 癌症诊断模型,并于 9 月 4 日登上 Nature。值得一提的是,CHIEF 是第一个能够预测患者预后并在多个国际患者群体中验证的模型。

全新的 CHIEF 模型则具有类似于 ChatGPT 的灵活性 —— 不仅能够执行多种任务,而且还能识别不同癌症类型需要特别关注的区域。通过读取肿瘤组织的数字切片,它可以检测癌细胞并根据图像中观察到的细胞特征分析肿瘤的基因特征。此外,还可以预测多种癌症类型的患者生存率,并精确定位肿瘤周围组织的特征,即肿瘤微环境。这些特征与患者对手术、化疗、放疗和免疫治疗等标准治疗的反应有关。更进一步的,CHIEF 还具有生成新见解的潜力 —— 它发现了此前未被认为与患者生存相关的特定肿瘤特征。

研究团队指出,这些发现进一步证明了 AI 可以帮助临床医生高效、准确评估癌症,包括识别可能对标准癌症疗法反应不佳的患者。(新智元)

Mistral 发布内容审核 API:支持中文等 11 种语言,可分类仇恨言论等 9 大类目

11 月 9 日消息,有报道称 Mistral AI 公司推出了全新的内容审核 API,满足日益增长的安全在线环境需求。该内容审核 API 基于微调的 Ministral 8B 模型,可以将内容分类到仇恨言论、暴力和个人数据泄露等 9 个类别。

该内容审核 API 支持中文、阿拉伯语、英语、法语、德语、意大利语、日语、韩语、葡萄牙语、俄语和西班牙语这 11 种语言,可以处理原始文本和分析对话内容。Mistral 还推出了 Mistral Batch API,专为需要处理大量数据的公司设计。该功能允许异步内容处理,Mistral 声称可将处理成本降低 25%。这一功能吸引了希望优化运营的企业,进一步巩

0 阅读:1

智能科技有评论

简介:感谢大家的关注