AI日报：广电总局整治AI“魔改”视频乱象；HailuoAI上线AI...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、广电总局发布“管理提示”整治AI“魔改”现象，经典影视遭恶搞

广电总局针对AI“魔改”视频现象发布管理提示，强调治理措施以保护经典文化。近期多部经典影视剧被恶搞改编，引发公众对传统文化的关注。管理要求各省局督促短视频平台清理相关内容，并落实生成式AI内容审核，以防止误导和侵权。

【AiBase提要:】

🚫 广电总局发布提示，要求治理AI“魔改”视频现象，保护经典文化。

🎥 多部经典影视剧被恶搞改编，影响公众对传统文化的认知与价值观。

🔍 平台需严格审核生成式AI内容，避免误导和侵犯版权。

2、海螺AI海外版上线超强AI语音克隆功能

海螺AI最近推出了其海外版的音频克隆模块，用户只需10到60秒的音频样本即可完美复刻自己的声音。这一技术突破在中文语音克隆领域引起了广泛关注，许多用户对其出色的音频克隆效果感到惊喜。该系统不仅操作简单，还支持多种语言和情绪选择，极大地满足了用户的需求。

【AiBase提要:】

🌟 只需10到60秒音频，海螺AI即可完美复刻用户声音，突破了中文语音克隆的瓶颈。

🎤 系统支持12种语言，用户可选择不同情绪，丰富语音表现。

💻 目前海螺AI音频功能免费使用，用户可轻松创建多个声音模型。

详情链接:https://www.hailuo.ai/audio

3、Runway Act One更新:将你的表演和声音无缝融入视频角色

Runway Act One的最新更新为视频制作带来了革命性的变化，允许用户将自己的表演和声音直接应用于其他视频角色，实现完美同步。这一技术突破不仅降低了创作门槛，还为影视创作提供了前所未有的灵活性，创作者可以随时随地进行试镜和表演转移。

【AiBase提要:】

🎭 多维度表演转移:动作、声音和表情可以无缝移植到任何角色上。

📱 便捷试镜:演员可随时用手机拍摄，轻松将表演转移到目标角色。

🖥️ AI结合:使用Midjourney等工具，创作者能将短视频延展为完整表演。

详情链接:https://top.aibase.com/tool/runway

4、OpenAI 即将发布全新 Sora 视频生成器，支持多种生成方式

OpenAI 最近在伦敦 C21Media 大会上宣布即将推出更新版的 Sora 视频生成器，该版本将支持文字、图像和视频的多种生成方式，极大地提升了用户的视频创作体验。新版本在效率和速度上都有显著提升，预计将在12月的冬季推广活动中正式发布，同时可能还会推出 GPT-4.5等其他新功能。

【AiBase提要:】

🌟 更新版 Sora 视频生成器将支持文字、图像及视频生成视频，提升创作灵活性。

🚀 新版生成器在速度和效率上都有显著提升，增强用户体验。

📅 预计将在12月的冬季推广活动中发布，可能同时推出 GPT-4.5等新功能。

5、超高清视频修复工具VISION XL 模糊视频一键变清晰

随着科技的进步，VISION XL作为一款视频修复和超分辨率工具，以其卓越的性能和易用性脱颖而出。它不仅能够修复视频缺失部分和去除模糊，还能显著提升视频清晰度，最高可达四倍超分辨率。其基于潜在扩散模型的处理框架，减少了对额外预训练模块的依赖，使得高分辨率视频的处理效率大幅提升。

【AiBase提要:】

✨ VISION XL能够修复视频缺失部分，去除模糊，提升清晰度，最高可达四倍超分辨率。

⚙️ 采用基于潜在扩散模型的处理框架，减少对额外预训练模块的依赖，提升处理效率。

🚀 仅需13GB显存即可处理25帧视频，处理时间不超过2.5分钟，适合快速应用场景。

详情链接:https://vision-xl.github.io/

6、马斯克旗下社交网络平台X上线图像生成器Aurora

埃隆·马斯克的社交网络X最近推出了新图像生成器Aurora，旨在创造照片般真实的图像。尽管上线后不久部分用户无法访问该功能，Aurora仍然允许用户生成包括米老鼠在内的公共和版权人物图像，且没有限制。该工具在生成静物和景观图像方面表现出色，但也存在一些不足，如图像中的物体融合不自然和人像缺失手指等问题。

【AiBase提要:】

🌟 新图像生成器Aurora上线，用户可生成多种图像。

🚫 部分用户在上线后几小时内无法访问该功能。

💰 X社交平台将Grok功能向所有用户开放。

7、谷歌新发布Gemini-Exp-1206模型横扫对手，超越ChatGPT成为AI新王

谷歌最新推出的Gemini-Exp-1206模型在生成AI领域引起了广泛关注，凭借1379的高分在LMArena排行榜上超越了ChatGPT-4.0的1366分，展现了其卓越的综合能力。尽管Gemini-Exp-1206在多项评估中表现出色，但在投票数量上仍落后于ChatGPT-4.0，显示出后者在可靠性方面的优势。

【AiBase提要:】

🌟 Gemini-Exp-1206在LMArena排行榜上取得1379分，超越ChatGPT-4.0的1366分。

🗳️ ChatGPT-4.0获得21，929票，明显高于Gemini-Exp-1206的5052票，显示出其可靠性。

🔍 Gemini实验模型为开发者提供了前所未有的AI体验机会，但仍处于测试阶段，不适合生产使用。

详情链接:https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn

8、NegToMe重新定义图像生成:降低版权风险提升多样性改善视觉效果

NegToMe是一项颠覆性的图像生成技术，利用图像驱动的对抗性指导方法，突破了传统负面提示的局限，显著提升了生成图像的多样性和质量。它通过降低生成内容与版权作品的相似度，解决了版权保护的问题，同时在跨域应用中也表现出色，为创作者提供了更大的创意自由。未

【AiBase提要:】

🎨 NegToMe通过图像驱动的对抗性指导方法，显著提升了生成图像的多样性，尤其在种族和性别处理上表现突出。

🔒 该技术降低生成内容与版权作品的相似度，测试显示相似性降低了34.57%，有效解决版权保护问题。

⚙️ NegToMe集成便捷，开发者只需少量代码即可应用，推理时间几乎不受影响，兼容多种扩散模型。

详情链接:https://github.com/1jsingh/negtome

9、X向所有用户开放Grok AI 普通用户也可以白嫖生图了

xAI最近宣布其聊天机器人Grok已向全球用户开放，提供了一个低成本的AI体验机会。用户在免费版本中受到一些使用限制，如每日图像创作和信息发送数量的限制。这一举措不仅吸引了更多用户了解AI技术，也反映了xAI在推广产品时的商业策略。

【AiBase提要:】

🖼️ Grok允许用户每天最多创作或分析3张图片。

💬 用户在两小时内只能发送10条信息，以控制使用频率。

📈 xAI通过免费开放Grok来吸引用户，未来可能推出更多付费功能。

10、Google Photos推出2024年度照片回顾:AI智能生成，记录你的精彩瞬间

随着数字科技的发展，Google Photos推出了2024年度照片回顾功能，利用AI技术为用户提供个性化的体验。通过Gemini AI，用户可以获得智能生成的照片标注，回顾重要时刻和拍摄数据。尽管这一功能为用户带来了分享美好回忆的机会，但也可能唤起一些不愉快的回忆。

【AiBase提要:】

🤖 AI技术生成个性化的照片标注，突出年度重要时刻。

📊 提供详细的拍摄数据统计，方便用户分享个人指标。

😢 可能唤起一些不愉快的回忆，AI尚未完全理解用户的情感需求。

11、OpenAI 决定与军方承包商合作，内部员工发声反对!

OpenAI与安杜瑞尔的合作引发员工的强烈反响，许多人对技术在军事上的应用表示担忧，要求更多透明度。尽管管理层强调合作仅限于防御系统，但员工对这一界限表示怀疑。

【AiBase提要:】

🌐 OpenAI与安杜瑞尔的合作引发员工对AI军事应用的担忧。

🛡️ 管理层强调合作仅限于防御系统，但员工对技术应用的限制性表示怀疑。

📉 政策转变显示OpenAI开始接受其技术在军事领域的应用。

12、AI 专家:一次 ChatGPT 查询相当于需要浪费半升水

生成式人工智能的快速发展带来了环境问题，尤其是能源和水资源的消耗。凯特・克劳福德教授在讲座中指出，若不采取可持续性措施，生成式人工智能的能耗将在一年内达到与日本相当的水平。

【AiBase提要:】

🌍 一次 ChatGPT 查询会浪费半升水，提醒人们关注人工智能对水资源的影响。

⚡ 生成式人工智能的能耗可能在一年内达到日本的水平，需制定可持续发展计划。

🤝 可持续性应成为人工智能行业的首要任务，而不是竞争排名。

玩酷网

AI日报：广电总局整治AI“魔改”视频乱象；HailuoAI上线AI...

科技家的家人们