要闻提示
1.特朗普胜利利好人工智能监管:AI 将获得自由奔放资格2.字节跳动 AI 助手豆包被曝开启视频生成内测3.阿里测试 AI 创作工具 Animode,参与动漫制作4.淘宝升级 AI 产品“生意管家”,双 11 期间服务 400 万商家5.微软申请专利以应对 AI “幻觉” 问题今日头条
特朗普胜利利好人工智能监管:AI 将获得自由奔放资格
11 月 7 日消息,特朗普战胜对手哈里斯,成为美国第 47 任总统。此前,特朗普曾多次表示,他计划在任职第一天废除拜登政府的《人工智能行政命令》,并与那些严厉批评除最宽松的监管之外的所有监管者的势力结盟,转而推行宽松的 AI 监管政策,减少对企业的报告要求,避免披露商业机密。
共和党人希望新政策侧重于 AI 的物理安全风险。由于联邦层面监管可能放松,加利福尼亚等州正在采取独立措施,通过相关立法填补空白。同时,特朗普政府可能加强对中国的 AI 技术出口管控。专家警告全球应加强 AI 治理,避免 AI 问题成为党派争端,以应对全球性的技术和伦理风险。
业内人士呼吁则监管者,无论其政治立场如何,都不要忽视人工智能带来的机遇和危险,牛津互联网研究所数据伦理学教授桑德拉·沃赫特表示“(人工智能带来的)这些危害不分地域,也不关心党派界限。我只能希望人工智能治理不会沦为党派问题——这是一个影响我们所有人、所有地方的问题。我们都必须共同努力,找到良好的全球解决方案。"(大G.AI商业、鞭牛士)
国内资讯
字节跳动 AI 助手豆包被曝开启视频生成内测
11 月 7 日消息,字节跳动旗下大模型 AI 助手豆包正式推出视频生成内测,支持图片文字一键成片、动态运镜和多镜头一致性、风格比例随意挑选。
据火山引擎总裁谭待介绍,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。他表示,无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。
此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。豆包视频生成模型基于 DiT 架构,通过高效的 DiT 融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。(IT之家)
字节推出单图视频驱动模型 X-Portrait 2:一键生成相同表情神态,简化创作流程
11 月 6 日消息,字节推出单图视频驱动模型 X-Portrait 2,不同于以往依赖人脸关键点检测的单图驱动方法,X-Portrait 2 构建了一个表情编码器模型,通过一种端到端自监督训练框架,能够从大量人像视频中自学习 ID 无关的运动隐式表征。
同时,该模型不仅能保留原图的 ID,还能捕捉并迁移从细微到夸张的表情和情绪,简化了现有动作捕捉、角色动画和内容创作流程。进一步将这个编码器与强大的生成式扩散模型相结合,即可生成流畅且富有表现力的视频。经过在大规模高质量表情视频上的训练,X-Portrait 2 在运动表现力和 ID 保持性方面显著优于先前技术。(IT之家)
阿里测试 AI 创作工具 Animode,参与动漫制作
11 月 7 日讯,据报道,阿里巴巴正在测试 AI 视频创作工具 Animode,该工具可以帮助用户制作动画风格的视频。Animode 是一款视频一键动漫化的 AI 工具,可以通过视频转换视频的功能将诗篇转换成二次元风格。Animode 内置有多种样式,包括 3D 场景、动画场景,以及 VR 现实融合模式等,可快速创建复杂的场景。
此外,Animode 能够捕捉真人动作,用于创建动作实时同步的二次元角色上,为此,内置有动作库、视频转运动、一键创建语音等功能。(品玩快讯)
淘宝升级 AI 产品“生意管家”,双 11 期间服务 400 万商家
11 月 6 日消息,媒体获悉,今年天猫双 11,电商 AI 全方位服务商家经营。数据显示,淘宝面向所有商家上线的 AI 产品生意管家,双 11 期间已累计服务 400 万商家,帮助中小商家生成超过 1 亿件商品及营销素材,帮助超 80 万商家进行了超 200 万次的数据流量分析。
据悉,淘宝在过去一年多次升级商家侧 AI 产品,并于十月初正式上线“生意管家”,整合了素材生成、数据服务、经营代理等多项 AI 工具及能力,为所有淘宝天猫商家备战双 11 提供高效生产力。
数据显示,天猫双 11 期间,全站推广助力商家好货更快打爆,近 29 万商家、超 160 万商品实现生意增长,活跃客户成交日同比增长超 6 倍。爱步、乐卡克、无印良品 MUJI 等品牌使用 AIGC 图片生成能力,素材点击转化率至高提升 97%;妮维雅采用 AIGC 视频生成能力,素材点击转化率至高提升 300%。(飞象网)
视觉中国:子公司拟参设基金,投资北京智谱华章公司股权
11 月 6 日,视觉中国公告,公司全资子公司华夏视觉拟与海南智桥私募基金管理合伙企业业(有限合伙)共同投资盐城智华创业投资基金合伙企业(有限合伙),担任有限合伙人。盐城智华认缴出资总额为 1.3 亿元,华夏视觉认缴 3000 万元,占比 23.075%。
盐城智华将直接或间接投资于北京智谱华章科技有限公司股权。此次投资基金主要目的在于借助专业投资机构的优势,拓宽公司在 AIGC 等领域的投资和布局。公司将在此次投资的基础上,与北京智谱华章签署战略合作协议,共建基于版权合规数据的“视觉大模型”,开发满足行业应用场景的 AI 产品。(钛媒体App)
小鹏发布 AI 人形机器人 Iron:1:1 复刻真人、已下工厂拧螺丝
11 月 6 日,小鹏汽车发布全新的 AI 人形机器人 Iron。这款机器人采用了和真人 1:1 打造,身高 178 cm、体重 70 kg、全身主动自由度 62 个、手部可动自由度 15 个。作为对比,特斯拉 Optimus 机器人身高 172cm、体重 73 kg(第一代数据,第二代减重 10kg )、全身主动自由度 200+ 个、手部可动自由度 27 个。其他方面,小鹏 AI 人形机器人”大脑“采用最新自研图灵 AI 芯片,拥有 3000T 的算力,能够像人一样思考记忆,同时也让手脚自主活动。并与智驾体系同源,采用了 AI 汽车上的鹰眼视觉系统,可以 720° 无死角看世界,还运用了端到端大模型和强化学习算法,让机器人行走有像驾驶般的能力。
小鹏天玑 AIOS,给机器人流畅自由对话的能力,有记忆、能推理,真正像人一样活动。目前该款机器人已经在小鹏广州工厂进行小鹏 P7+车型生产实训,小鹏 Iron 未来将会聚焦在工厂和门店等场景。(快科技)
美图再度携手三星,AI 创新功能助力用户创意实现
11 月 7 日消息,三星宣布了与美图的最新合作,这已经是双方今年的第三次联手。根据合作协议,三星手机将首次预装上美图秀秀 App,为用户带来更为丰富的图像编辑体验。此次合作中,美图奇想大模型(MiracleVision)技术将深度集成到三星 W25 和 W25 Flip6 系列手机中。用户将能够享受到包括“ AI 无痕消除”、“白板涂鸦”、“图像风格化”以及“壁纸生成”等一系列先进的 AI 图像生成与编辑功能。
据悉,此次合作是基于美图奇想大模型开放平台进行的。该平台是美图公司推出的重要 AI 技术服务平台,专注于为企业提供专业的 AI 算法服务和定制化解决方案。自 2019 年上线至今,已成功服务了智能设备、智能汽车、金融、传媒、消费等多个行业的众多头部企业客户。业内分析人士认为,美图与三星的此次合作进一步展现了美图在人工智能影像与设计领域的领先地位,同时也助力了行业客户在品牌力和生产力方面的多维度提升。(电动新物种)
首台“重庆造”国产服务器下线:搭载华为鲲鹏 920+昇腾 AI 处理器
11 月 7 日消息,首台“重庆造”国产服务器下线仪式在重庆科学城芯鸿数智科技有限公司举行。芯鸿数智是由拓维信息系统股份有限公司与重庆高新开发集团下属重庆科学城科技产业发展有限公司共同出资设立。
通过此次合作,芯鸿数智将持续加大研发投入,打造基于“鸿蒙+AI ”的软硬一体化产品和人工智能行业标杆应用。兆瀚 RA2300-A 系列服务器是一款基于鲲鹏 920 处理器+昇腾 AI 处理器的 2U 机架式推理服务器,支持 Atlas300I Pro 推理卡、Atlas 300V Pro 视频解析卡,能够为用户提供强大的实时推理能力。作为 AI 推理专用服务器,该系列服务器可广泛应用于中心侧 AI 推理场景,具有超强计算性能、低能耗、易于部署维护和支持云边协同等特点,满足多种多样的人工智能应用场景的算力需求。
芯鸿数智智能计算制造基地已在西部(重庆)科学城正式投产运行,可实现年产服务器 6 万台、台式电脑 10 万台,未来将进一步吸引上下游配套企业聚集。(快科技)
北京首座大模型“超级工厂”落户京西
11 月 7 日消息,由中关村科技园区石景山园管理委员会、北京市石景山区科学技术委员会主办的人工智能大模型产业创新发展大会上,百度智能云千帆大模型产业(北京)创新基地服务平台启动上线。
目前创新基地已集聚十余家具备行业大模型训练和垂直领域应用开发能力的企业,入驻企业已累计完成 120 余次模型训练,模型训练和推理消耗 token(数据或文本的基本单元)数超过 6 亿。(钛媒体APP)
晶泰科技与金光集团建立全面合作,AI 赋能共创营收爆发点
近日,晶泰科技宣布与印尼第一财团金光集团宣布通过其旗下支柱企业——金光金融集团,正式签署战略合作。双方将通过建立合资公司,在多个工业领域展开全面合作,共同推进亚太地区人工智能(AI)产业的未来革新。
金光集团(Sinar Mas Group)作为印尼最具影响力和多元化的企业集团之一,在医疗保健、矿业、可再生能源、物流、消费品、化工和金融服务等领域占据主导地位。晶泰科技是全 AI+机器人新药及新材料研发平台,已累积服务超 300 家来自全球的顶尖企业及科研机构。
晶泰科技与金光集团的深度合作,或将解锁强大的专业协同效应,以前沿科技在多个领域催生具有开创性和巨大商业潜力的解决方案,显著推动双方的收入增长,并进一步促进区域经济扩张。两家公司表示期待此次携手,共同抓住东南亚地区蓬勃发展的 AI 市场所带来的机遇,树立集创新力、竞争力与经济影响力于一体的商业合作典范。(格隆汇)
平均招聘月薪 24000 元,却预计将有 3 亿个工作岗位被生成式 AI 取代
北京大学国家发展研究院近期与智联招聘联合发布的《 AI 大模型对我国劳动力市场潜在影响研究》报告显示,2024 年上半年招聘的 AI 相关职业当中,大语言模型方面的自然语言处理职位数同比增速 111%,深度学习岗位增 61%,机器人算法岗位增 76%,自动驾驶的智能驾驶系统工程师增 49%,导航算法增 47%。
值得注意的是,报告中提到,2024 年上半年,自然语言处理岗位的平均招聘月薪达到 24007 元,深度学习岗位月薪则达到 26279 元,位列 AI 相关岗位前列。AI 技术一面在提高人类生活生产效率,企业加大 AI 相关人才招聘和薪资力度,另一面不断用“智能化”取代人类部分模式化工作,失业(被 AI 取代)成为了无数打工人心中的阴霾,高盛曾预计,全球预计将有 3 亿个工作岗位被生成式 AI 取代,包括律师、行政人员等重要岗位。
北京大学国家发展研究院助理教授胡佳胤在解读中表示,在 AI 时代,原地踏步的人将感受到更大的“威胁”,软件/硬件研发、运维/测试两大影响指数较高的职业,他强调,职场人在关注就业市场变化趋势的同时,尽早学习使用 AI 工具,并强化大模型无法替代的软技能,如创造力、沟通能力、组织协调能力等,驱使 AI,才能拥抱 AI 。
智联招聘执行副总裁李强表示,AI 技术发展,在短期内造成某些行业的人才供给不足,但持续拥抱技术,AI 和自动化技术会提高工作效率推动企业向更加灵活的用工模式,如项目制或合同制转型,也会带来更多的高质量岗位。在互联网时代来临之时,大家也曾经面临类似挑战,但最后新技术带来整个社会效率的提升,创造了很多互联网产业链上的相关岗位,如跨境电商已经替代了大部分的传统贸易。(钛媒体AGI)
中兴通讯 7 亿元在北京成立技术公司,含多项 AI 业务
近日,北京兴云数科技术有限公司成立,法定代表人为王喜瑜,注册资本 7 亿元人民币,经营范围含信息系统集成服务、物联网技术服务、数据处理和存储支持服务、人工智能基础软件开发、人工智能应用软件开发、大数据服务、信息咨询服务等。股东信息显示,该公司由中兴通讯全资持股。(每日经济新闻)
国际资讯
微软推出 Magentic-One:多 AI 智能体协同完成复杂任务
11 月 7 日消息,微软本月发布 Magentic-One 系统,通过协调多个专用 AI 智能体,高效处理复杂工作流程。
Magentic-One 系统隶属于 AutoGen 开源平台,在不同环境中无缝编排任务,进一步巩固了微软在 AI 任务自动化中的地位。Magnetic-One 的核心是协调器代理(Orchestrator),它负责管理框架内的多个子智能体,该协调器不仅是任务调度器,更是高效完成任务的蓝图设计者。
该协调器通过构建“任务账本”(task ledger)来启动操作,并在项目进展中维护“进度账本”(progress ledger),确保每个阶段的任务都能按时完成。Magnetic-One 通过协调器指挥四个主要代理:WebSurfer 智能体、FileSurfer 智能体、编码智能体、计算机终端智能体,四个代理各自承担不同的角色,共同实现任务的无缝执行。协调器的自适应特性使其能够监控项目的每个阶段,及时调整计划以应对障碍。如果某个代理在特定步骤上遇到困难,协调器会重新分配任务或更新策略,确保项目持续推进。这种灵活性使 Magnetic-One 在任务执行中展现出人类般的适应能力。(IT之家)
GPT-4o 加钱能变快,新功能“预测输出” 7 秒完成原先 23 秒的任务
OpenAI 发布了一项名为“预测输出”(Predicted Outputs)的新功能,使得 GPT-4o 的响应速度提升至原先的 5 倍,适合文档更新、代码重写等无需从头生成的任务。此功能通过跳过不变内容,使模型在处理编程、迭代任务时显著提速。例如,某些编程任务原需 70 秒,现在仅需 20 秒。
尽管速度更快,但“预测输出”功能存在一定限制,例如仅支持 GPT-4o 系列,且不兼容多项 API 参数。此外,预测不使用的 tokens 仍按完成费率收费,使得新功能在速度提升的同时成本有所增加。(大G.AI商业)
微软申请专利以应对 AI “幻觉” 问题
近日,微软提交了一项专利申请,旨在通过一种技术方法减少或消除人工智能生成的虚假信息。该专利的名称为 “利用外部知识和反馈与语言模型互动”,这一提案的核心是为 AI 模型提供一种 “响应增强系统”(RAS),使其能够根据用户的查询自动提取更多信息,并检查其回答的 “有效性”。
响应增强系统能够识别是否有来自 “外部来源” 的信息能够更好地回答用户的问题,如果 AI 的回答没有包含这些信息,该系统会将其判定为不够有用。此外,RAS 还可以向用户提示其回答是否存在不足之处,用户也可以对此进行反馈。这一方案的优点在于,不需要开发者或公司对现有模型进行细致的调整。
该工具为企业 AI 聊天机器人提供了 AI 驱动的验证,能够在后台进行事实核查,判断 AI 的回答是否 “无根基” 或 “有根基”,在向用户提供答案之前,只提供有实际