超过150万个大模型,DeepSeek全球最受欢迎

科技确有核芯 2025-02-25 21:22:54
电子发烧友网报道(文 / 吴子鹏)北京时间 2 月 24 日凌晨 3 点,全球最大开源平台之一 huggingface 联合创始人兼首席执行官 Clement Delangue 发布的最新数据显示,中国开源大模型 DeepSeek-R1 在 huggingface 平台上超过 150 万个模型中脱颖而出,成为该平台最受欢迎的开源大模型,点赞数突破 1 万。 目前,DeepSeek 已在全球范围内成为爆火的 AI 大模型。1 月 26 日,DeepSeek 首次登上苹果 App Store 全球榜首并持续领先。上线 18 天,其下载量达到 1600 万次,几乎是同期 ChatGPT 下载量的两倍,其中印度是新用户增长的最大来源地。据统计,DeepSeek 目前在全球 140 多个国家的 App 榜单中位居第一。 在流量方面,2025 年 1 月,DeepSeek 网站的桌面和移动访问量飙升至 2.78 亿次,而2024年12月仅为 1200 万次。中国贡献了近四分之一的桌面流量,美国、巴西、印度、德国等国家也占据一定比例。 此前,Clement 特意发文祝贺 DeepSeek-R1 下载量突破 1000 万次,这一成绩也创造了 huggingface 平台有史以来最受欢迎模型的记录。 那么,DeepSeek 究竟给开源大模型的发展带来了什么,使其如此火爆? DeepSeek 给开源大模型发展带来的影响DeepSeek 通过技术创新和商业策略的突破,重塑了开源大模型行业的竞争格局,为开源 AI 大模型的发展带来了积极影响。 带动技术创新DeepSeek 在模型训练中采用强化学习和模型蒸馏技术,在减少模型参数规模的同时提升性能。例如,R1 模型在数学推理任务中的准确率高达 97.3%。在架构设计方面,以 DeepSeek-V3 为例,其首创多头潜注意力机制,有效解决了长文本推理时的显存效率瓶颈问题,还革新了动态路由算法,提高了专家利用率。 降低成本DeepSeek 降低了开源大模型的训练成本、推理成本和模型使用成本。其采用的混合专家模型(MoE)架构利用动态冗余策略,将计算成本降低至传统模型的 1/10。结合自研的稀疏结构(MLA 架构),提升了推理效率,实现了性能与成本的平衡。通过纯深度学习方法,DeepSeek 使 AI 涌现出自发推理能力,在数学、代码、自然语言推理等任务上达到国际顶尖水平(如比肩 GPT-4/o1)。借助这些创新,DeepSeek 将大模型训练成本压缩至 560 万美元量级,仅为美国同类模型的 1/100,打破了动辄数亿美元投入的行业惯例。同时,DeepSeek 通过开源以及提供低成本的 API,开发者可以自由定制和二次开发。其 API 定价亲民,仅为 OpenAI 同类产品的 1/10,让中小企业能够以较低成本进入 AI 领域,推动了大模型在更多领域的应用和创新。 拓展应用边界DeepSeek 拓展了开源大模型新的应用边界,使 AI 大模型得以广泛落地。DeepSeek 采用免费商用开源策略,完全开放模型源码并支持衍生开发,推动开发者生态快速扩张。这种 “零门槛 + 零成本” 模式直接导致行业价格体系崩塌,API 使用成本降至 OpenAI 的 5%,最终引领市场进入 “按厘计价” 甚至零成本时代。这一举措激发了全球开发者的热情,推动了技术共享与社区协作。众多开发者基于 DeepSeek 的模型进行创新,加速了垂直领域小模型的发展。同时,DeepSeek 凭借模型压缩等技术,成功适配智能眼镜、工业终端等边缘设备。在金融交易、工业质检、医疗影像分析等众多垂直领域展现出独特的应用优势,为各行业的数字化转型提供了强大动力,极大地拓展了开源大模型的应用场景。 推动模型融合DeepSeek 推动了开源大模型和闭源大模型的融合。其开源模型 R1 发布后,迫使阿里、腾讯等巨头跟进降价,同时刺激全球开发者社区加速创新。在这个过程中,相当一部分闭源大模型选择与 DeepSeek 进行融合。例如,2025 年 2 月,文心一言(现更名为 “文小言”)App 的 4.9.0 版本更新,接入了 DeepSeek-R1 开源大模型,借助该模型优化了拍照解题功能,通过 “思维链” 技术将解题过程可视化;2 月 6 日,吉利汽车宣布将自研的星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等与 DeepSeek R1 大模型深度融合,以重新定义智能汽车的人机交互及智能驾驶;医渡科技的 “AI 医疗大脑” YiduCore、智云健康的 “智云大脑” 等医疗领域的闭源模型也接入了 DeepSeek-R1 模型,用于升级智能预问诊、病历生成与质控等核心医疗 AI 应用。DeepSeek 的成功促使其他大模型开发者如 OpenAI、百度等开始重新审视开源策略,对整个行业的发展起到了积极的推动作用。 毫无疑问,DeepSeek 改变了 AI 大模型的市场格局。凭借低成本、高性能、全国产的特点,引发人工智能产业生态巨变,在一定程度上冲击了 OpenAI 等巨头主导的市场格局,加快形成大模型市场的新增长极,推动了整个行业的创新发展。
0 阅读:1

科技确有核芯

简介:感谢大家的关注