Meta新AI团队成员大起底：8位华人，清北、浙大校友占半壁江山1. **项目概

Meta新AI团队成员大起底：8位华人，清北、浙大校友占半壁江山

1. **项目概述**

1.1 **核心目标**

华为开源项目 Omni-Infer 旨在解决超大规模MoE模型（如DeepSeek）的推理效率问题，提供 “开箱即用” 的解决方案，覆盖架构设计、技术实现与代码开源。

1.2 **定位与优势**

• 企业级价值：支持PD分离部署、系统级QPM优化、硬件使用方法论分享。

• 开源生态：与主流框架（如vLLM/SGLang）兼容，降低维护成本。

• 社区共建：联合北京智源研究院、上海人工智能实验室等机构推动生态合作。

2. **技术架构与功能**

2.1 **核心组件**

• 推理框架：

• 兼容vLLM等主流框架，独立安装（解耦设计）。

• 持续扩展对昇腾硬件平台的支持（如SGLang）。

• 加速套件：

• 智能调度：xPyD调度系统，支持分布式低延迟部署。

• 负载优化：预填充与解码阶段动态调整，提升吞吐量。

• MoE专项支持：适配EP144/EP288等配置，优化专家模型协作。

2.2 **关键技术亮点**

• 资源分配：分层非均匀冗余、近实时动态专家放置。

• 注意力机制优化：针对LLM/MLLM/MoE模型强化性能。

---

3. **部署与实践**

3.1 **环境要求**

• 硬件：仅支持CloudMatrix384推理卡

• 系统：Linux + Python 3.9~3.11

• 安装方式：Docker镜像集成（预装CANN/Torch-NPU依赖）

3.2 **部署流程**

1. 拉取镜像：

```bash

docker pull swr.cn-southwest-2.myhuaweicloud.com/omni-ai/omniinfer:202506272026

```

2. 验证安装：

```bash

pip list | grep omni_infer

```

3. PD分离部署示例（4机2P1D）：

• 参考文档教程，少量代码即可完成。

4. **开源生态与社区建设**

4.1 **开放治理机制**

• 两级决策：项目管理委员会（PMC） + 特别兴趣小组（SIG）。

• 透明协作：开放社区仓库（代码规范、设计文档、会议记录）。

4.2 **生态合作**

• 主动适配：与FlagScale、DeepLink等国内项目深度对接。

• 活动参与：联合OpenInfra基金会举办Meetup，推动技术交流。

玩酷网