玩酷网

[LG]《Latent Zoning Network: A Unified Pr

[LG]《Latent Zoning Network: A Unified Principle for Generative Modeling, Representation Learning, and Classification》Z Lin, E Liu, X Ning, J Zhu... [Microsoft Research & Tsinghua University] (2025)

Latent Zoning Network (LZN):机器学习三大核心任务——生成建模、表征学习与分类的统一框架

• LZN将所有数据类型(图像、文本、标签)映射到一个共享的高斯 latent 空间,通过划分互不重叠的“latent zones”实现统一表达。

• 训练和推理基于两大核心操作:latent computation(利用flow matching从编码器输出的anchor points构造高斯latent zones)及latent alignment(通过软分配策略对不同数据类型latent zones进行有效对齐)。

• LZN支持多种任务模式:单模块独立任务(如无条件图像生成、图像嵌入);跨模块任务(如标签条件图像生成、图像分类);多任务联合训练(生成与分类相辅相成,性能超越单独训练)。

• 在无监督表征学习中,LZN无需对比损失即可实现,超越MoCo 9.3%、SimCLR 0.2%(ImageNet线性分类);在生成任务中,结合Rectified Flow,FID在CIFAR10上从2.76降至2.59,重构误差显著降低。

• LZN架构天然具备扩展多模态、多任务的潜力,未来可通过更多编码器-解码器对实现复杂任务协同,提升模型泛化与交互能力。

心得:

1. 统一latent空间的设计突破了传统各任务孤立模型的壁垒,实现了信息共享与功能复用,简化了机器学习管线。

2. 利用flow matching构建latent zones,兼顾生成的高斯先验与样本判别的互斥性,为多任务学习提供了数学保障。

3. 软化离散latent分配的优化策略避免了非微分性问题,提高训练稳定性,同时促进了跨模态对齐和任务协同。

详见🔗arxiv.org/abs/2509.15591

项目代码🔗github.com/microsoft/latent-zoning-networks

项目介绍🔗zinanlin.me/blogs/latent_zoning_networks.html

机器学习生成模型表征学习分类统一模型流匹配多任务学习