盘古大模型进化路径可分为L0-L1-L2三个阶段,L0基础大模型包括NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型以及Graph(图网络)大模型。L1是行业大模型,L2是面向更加细分场景的推理模型,上层是在下层的基础上演化而来,层层递进,确保在真实产业场景中的效率和适用能力。
盘古大模型具备极强的泛化能力,适用大量复杂场景。盘古NLP大模型学习了40TB的中文文本数据,CV大模型包含了30亿+参数,并通过行业数据的小样本调优,提高了大模型的泛化能力以及算法对新鲜样本的适应能力,此外,基于产业场景中存在大量的内容理解需求,盘古大模型在预训练阶段沉淀了大量的通用知识,使得大模型有能力支持行业知识库和数据库的嵌入,对接行业经验。
预训练+下游微调的工业化AI开发模式赋能千行百业。盘古CV大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求,同时能够融合行业知识的微调,快速适配各种下游任务。此外,盘古CV大模型在预训练阶段主要集中在数据处理、架构设计和模型优化三个阶段进行优化。目前盘古CV大模型在Image Net 1%、10%数据集上的小样本分类精度上均达到目前业界最高水平。建议关注
算力:神州数码;
操作系统:中国软件、诚迈科技;
行业应用:海量数据、万达信息、华宇软件、云鼎科技、北路智控、龙软科技、梅安森、智洋创新
重点关注:神州数码,诚迈科技,软通动力