近日,来自盛大集团的AI团队在人工智能技术领域取得了重要进展,其自研的 OMNE Multiagent大模型多智能体框架登上 Hugging Face 发布的 GAIA 基准测试排行榜(https://huggingface.co/spaces/gaia-benchmark/leaderboard)榜首,超越了包括微软研究院在内的众多顶尖机构的多智能体框架。
GAIA 是由 Meta AI、Hugging Face 和 AutoGPT 联合推出的基准测试系统,旨在提供一个涵盖真实世界问题集的测试环境,用于全面评估 AI 助手的能力,包括推理、大模型多智能体处理、网页浏览和工具使用等核心功能,是当前最具挑战性的多代理智能评估数据集。OMNE框架能够在如此严苛的榜单中拔得头筹,充分体现了盛大 AI 团队的技术深度与创新能力。
OMNE是一个基于LTM(Long Term Memory)的多智能体协作开发框架。在这一框架中,每个智能体都拥有相同且独立的系统结构,能够自主学习并存储完整的世界模型,从而独立构建对环境的理解。通过这种基于LTM 的协作开发,AI 系统能够实时适应个体行为的变化,优化任务规划与执行,进一步推动个性化与高效的AI 自我进化过程。盛大AI 团队通过在多智能体系统中的创新实践,使得 OMNE在复杂任务协调、自主决策以及资源分配等关键技术上实现了显著提升。
“我们非常自豪地看到 OMNE 框架登上 GAIA 榜首。”盛大 AI 团队负责人表示,“这表明了利用LTM 进行AI 自我进化以及解决现实世界问题的巨大潜力。我们相信,推进长期记忆和AI 自进化的研究,对于AI技术的持续发展和实际应用至关重要。”