DeepSeek百问百答(三)

哀上李金锐 2025-02-22 17:00:36
【综合类】 41、 目前各国政府对 DeepSeek 的反应如何? DeepSeek 百问百答(二) 清华出品!DeepSeek 保姆级使用教程,收藏!文末下载 答:DeepSeek 爆火引发了全球关注,各国基于自身利益和立场采取不同措施。一是采取限制和禁止措施。美国国会、海军、NASA等多方面已禁止使用DeepSeek,国会还提出法案,拟规定下载或使用DeepSeek为犯罪,最高可判20年监禁;意大利隐私监管机构要求提供用户使用数据问题的解释,后将DeepSeek从该国应用商店下架;加拿大、澳大利亚政府下令禁止在官方设备上使用DeepSeek产品服务;韩国多部门禁用且要求从2月15 日起暂停新用户下载。二是持谨慎态度,开展调查评估。英国、法国、德国、爱尔兰等国的相关监管机构以用户数据安全为由发起对DeepSeek的调查。三是积极拥抱。印度信息技术部长称赞DeepSeek是重大突破,政府计划将DeepSeek模型托管在本地AI计算设施上,希望通过学习DeepSeek模式推动本国AI技术的进步。 42、科技界权威人士对 DeepSeek 的看法是怎样的? 答:科技界权威人士对 DeepSeek的态度普遍非常认可:首先是OpenAI的CEO山姆·奥特曼多次公开表示“令人印象深刻”,尤其是性价比出色;著名风险投资人马克·安德森称DeepSeek-R1是他所见过的最令人惊叹的突破之一,作为开源,它是给世界的礼物;图灵奖得主杨立昆(YannLeCun)认为,DeepSeek的成功验证了开源模型的潜力,并强调开源生态对AI发展的积极影响;英伟达科学家吉姆 ·范称赞 DeepSeek 开放技术细节为全球研究者赋能。不过,也有 一些人持质疑态度:马斯克认为 DeepSeek 所宣称的训练成本没有包 含前期的研发投入,谷歌 Deepmind 负责人哈萨比斯也认为 DeepSeek 工程能力出色,但并未带来新的科学进展,外界对此炒作有点夸大。 43、DeepSeek 崛起后其他AI 厂商有哪些跟进措施? 答:国外方面,OpenAI、谷歌、Meta均迅速推出自己的最具性价比模型。1月31日,OpenAI发布其最具成本效益的推理模型o3-mini,同时首次向免费用户提供推理模型,还大幅降低API价格,应对DeepSeek的低价竞争;2月3 日,OpenAI上线推理能力极强、可独立完成复杂调研的DeepResearch智能体产品,首先开放给Pro用户,后又扩大开放给免费用户限量使用;2月6 日,OpenAI宣布扩大ChatGPT的搜索功能,取消用户注册限制,进一步降低使用门槛。谷歌在2月6 日发布了Gemini 2.0系列模型(包括Flash、Pro及Flash-Lite版本),进一步提升AI能力并降低价格(如Flash-Lite每百万tokens0.3美元),以增强市场竞争力。Meta成立了多个“作战室”,对DeepSeek模型进行逆向研发,以改善自身模型。2月18日,马斯克旗下人工智能公司xAI发布最新一代大模型Grok3,具备强大推理能力,在测试中表现优于目前市场上所有已发布的聊天机器人。 国内方面,阿里和字节跳动也迅速应对。阿里云在 2025 年 1 月 发布了通义千问旗舰版模型Qwen2.5-Max,该模型在多项公开评测基 准中表现优异,甚至超越了 DeepSeek-V3 和 Llama-3.1-405B 等开源 模型。字节跳动在 2 月举办了全员会,CEO 梁汝波在会上提出了字节跳动今年的重点目标,包括追求“智能 ”上限、探索新的交互和加强 规模效应,并反思在去年 OpenAI 公开发布长链思考时虽意识到技术 重大变化但跟进速度不够。 【部署类】 44、广东电信四大部署模式各有什么优劣势? 答:中国电信广东公司提供了四种 DeepSeek 部署模式,分别为 API模式、公有云池化模式、独占 910B 集群模式和私有化部署模式。 (1)API 模式 优势:一是接入门槛低,对于中小型企业而言,无需购置硬件、 无需搭建复杂的运行环境,能以较低成本快速启动AI 项目。二是部 署速度快,通过天翼云开放的标准化API接口,30 分钟即可让业务 具备AI 能力,如快速实现文本生成、代码编写等功能。三是使用灵 活,可根据业务需求和流量变化,灵活调整API调用量,适应短期高 并发需求,避免资源浪费。四是更新便捷,DeepSeek 持续优化和更 新模型,企业能通过API第一时间享受到最新技术成果。 劣势:对网络稳定性要求较高;存在一定数据泄露风险;相比本 地部署等模式,只能使用服务商提供的标准功能接口,可能无法完全 满足企业深度定制化需求。 (2)公有云池化模式 优势:一是成本低,以“算力资源池 ”形式开放,企业按需租用 GPU 时长,无需承担硬件采购成本和闲置成本,适合初创团队和周期 性业务需求场景。二是资源灵活调配,可根据业务量动态调整算力资 源,满足多项目并行测试时不同阶段的算力需求。三是运维简单,由 天翼云负责底层运维,企业只需关注自身业务应用,降低了运维难度和成本。 劣势:存在一定的性能瓶颈;数据隔离性相比私有化部署稍弱, 可能存在数据相互干扰的风险;对算力资源的控制和调整依赖于云服务提供商,企业自主性相对较弱。 (3)裸金属模式(独占 910B 集群模式) 优势:一是性能强劲,将 DeepSeek-R1直接部署于天翼云裸金属 服务器,企业独享整机算力资源,能彻底消除虚拟化损耗,满足大型 模型训练、金融高频交易决策等高算力刚需场景。二是稳定性高,独占资源避免了与其他用户的资源竞争,系统运行更加稳定,可确保关 键业务和高要求任务的连续性和准确性。三是数据安全性提升,相对 公有云池化模式,独占集群在数据隔离和安全性方面更有优势,减少 了多租户环境下的潜在安全风险。 劣势:成本高;资源利用率可能不足;灵活性稍差。 (4)私有化部署模式 优势:一是数据安全自主,将 DeepSeek-R1完整部署至客户本地 数据中心或私有云环境,数据完全由企业自主掌控,满足政府单位、 医疗机构等对数据主权要求严苛的场景。二是深度定制化,可根据企 业自身需求,将模型与本地业务系统、数据资源等进行深度融合和定制化开发,更好地满足特定业务需求。三是合规性强,能完全自主满 足特定行业的合规要求,如医疗行业的数据隐私法规、金融行业的监 管要求等。 劣势:前期投入大;运维成本和技术门槛较高;部署周期长。 45、在云端怎么部署使用 deep seek? 答:云端部署通常有两种使用方式,即 API调用方式与云资源部署方式。 API 方式十分简单。下面以天翼云 DeepSeek API服务为例。 在天翼云上通过API部署 DeepSeek 模型,用户可登录算力调度平 台,于应用市场订购 DeepSeek-R1-7B(API)服务。部署后,在控制台“应用详情 ”中获取API调用地址,支持两种调用方式: 命令行调用:通过 curl直接向API地址发送请求,快速获取模型推理结果; 可视化交互:运行 Docker 命令 docker run -d -e OLLAMA_BASE_URL={API 地址} --name open-webui ghcr.io/open-webui/open-webui:main 启动 open-webui 服务,通过 本地Web 界面(默认端口)进行交互式对话,兼顾易用性与可视化体 验。 如果想租用云资源或者物理机,自己搭建 DeepSeek 服务,则可以 通过下面的方案来实施。依旧以天翼云为例。 在天翼云上部署 DeepSeek 模型提供快速部署和灵活自定义两种 方案。对于快速部署,用户可直接选择预置的“Ubuntu 22.04@deep seek-r1-7b”公共镜像创建GPU物理机,系统将自动集成ollama服务、7B模型及Web可视化界面(端口3000)。启动5分钟 后通过http://公网IP:3000访问Web界面,完成管理员注册后即可使用模型,同时支持命令行调用ollamarundeepseek-r1:7b进行推理。该方案通过镜像预装实现开箱即用,适合快速验证7B模型能力。 若需自定义部署更大模型(如 70B/671B)或适配特定环境,可通 过天翼云镜像站加速下载模型文件,使用curl脚本一键安装ollama 及指定模型(如 MODELS=deep seek-r1:70b),或手动通过 wget 获取 模型文件后创建本地模型实例。部署完成后,可通过 Docker 运行open-webui组件扩展可视化功能。安全方面建议关闭非必要端口(如 3000/11434)、配置 IP 白名单,并在 Web 界面中禁用公开注册以强 化访问控制。 附参考链接: 部署 DeepSeek 推理 API 服务: https://www.ctyun.cn/document/10535270/10940507 物理机搭建 DeepSeek 指南: https://www.ctyun.cn/document/10027724/10948275 【技术类】 46、DeepSeek-R1 在中文任务中的表现为何低于英文?如何优化? 答:原因包括三个方面,一是数据偏差,RL 训练侧重 STEM 任务,中文语料占比低;二是语言对齐不足,冷启动数据以英文为主,中文 模板未充分优化;三是评测覆盖度不全,部分中文任务(如 C-SimpleQA) 涉及文化特定知识,模型未针对性训练。优化方向如下:一是增加中文冷启动数据比例;二是引入语言特定的格式奖励(如中文标点、术 语规范);三是扩展中文多任务 RL 训练(如文言文翻译、本土数学竞赛题)。模型像偏科生,更擅长国际数学题(英文),但对中国历史题(中文)准备不足。解决方法就是多给它做中文练习题,并规范 答题格式。 47、DeepSeek 是如何处理不确定性问题的(如模糊查询)? 答:主要是策略,一是置信度校准,输出概率低于阈值(如<0.7) 时触发“不确定 ”响应(如“可能需要更多信息 ”)。二是多假设生成,对模糊问题生成多个可能答案,并标注置信度(如“答案 a(70%概率):... ”),三是安全兜底,在 sft 阶段注入拒绝回答模板(如“该问题存在歧义,请澄清 ”)。最后的结果,模型对模糊问题的错误回答率下降28%。模型像“谨慎的医生 ”,遇到症状不明确的患者, 不会贸然开药,而是建议进一步检查(要求用户澄清问题)。 【生态类】 48、DeepSeek 的开源生态发展情况如何? 答:DeepSeek 的开源生态建设情况较为良好,呈现出多方面的积极发展态势。在企业接入合作方面,英伟达、微软、亚马逊、阿里云、腾讯云、百度云、华为等国内外AI 巨头纷纷宣布接入 DeepSeek-R1。 高校和开源社区方面,加州大学伯克利分校、香港科技大学、开源平台HuggingFace等团队宣布复刻了DeepSeek-R1-Zero和DeepSeek-R1,且性能表现良好;DeepSeek-R1成为斯坦福大学和 MIT 等顶尖高校研究人员的首选模型。 49、国产芯片对 DeepSeek 系列模型的适配情况如何? 答:截至 2月14 日,已有24家国产AI芯片公司宣布适配或上架DeepSeek模型服务,主要聚焦推理应用,适配了DeepSeek原版或“蒸馏”后的小尺寸版本。如:华为宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用。海光信息完成DeepSeekV3模型、R1模型、Janus-Pro多模态大模型与海光DCU的适配优化,并正式上线。云天励飞完成DeepEdge10芯片平台与DeepSeek-R1(1.5B、7B、8B)大模型的适配。龙芯中科宣布,搭载龙芯3号CPU的设备成功启动运行DeepSeek-R1 7B模型,实现本地化部署。摩尔线程的夸娥(KUAE)GPU智算集群支持DeepSeek-V3/R1模型及蒸馏模型的分布式部署。壁仞科技自研的壁砺系列通用GPU芯片支持DeepSeek-R1从1.5B到70B各等级参数版本蒸馏模型。 50、国内外云平台如何提供 DeepSeek系列模型服务? 答:国内外数十家云巨头宣布接入 DeepSeek系列模型。海外市场,亚马逊云科技AWS、微软云Azure、英伟达NIM等云巨头迅速响应。国内市场,三大运营商云,阿里云、华为云、腾讯云、百度智能云、京东云、火山引擎等头部云平台,和派欧云、优刻得等独立云服务商纷纷加入。绝大部分接入的厂商提供以下两种服务模式:一是以 API对外提供,用户直接调用DeepSeek模型,无需考虑运维和部署环境,按调用token量计费。二是基于云厂商的软硬件服务,用户自定义部署DeepSeek模型和环境并自行运维,按算力、存储等资源计 费,以满足安全或者垂直行业训练、精调的需求,如通过 MaaS平台、 AI开发服务平台进行部署,推出DeepSeek大模型一体机等。 【应用落地类】 51、SaaS 类软件企业接入 DeepSeek的最新进展如何? 答: 目前已有多家SaaS类公司接入DeepSeek。如汇通达“千橙云SaaS+”平台全面接入,实现了“数字化管理”“智能化服务”“营销服务”“供应链优化”和“全渠道经营拓展”等技术能力的全面升级;1688已接入并向商家开放,还将于2月上线基于DeepSeek的生意大模型;金蝶宣布全面接入DeepSeek大模型,将AI深度融入SaaS应用与苍穹Agent平台。预计,DeepSeek在SaaS类软件方面的应用场景将持续拓展,在采购、营销、客服等多领域深化,并进一步促使SaaS产品个性化、定制化发展。 52、DeepSeek 在国内医疗行业的应用进展如何? 答:2 月以来,医疗领域超 20 家医疗和医药机构相继宣布接入 DeepSeek。一是智云健康、方舟健客、平安健康、卫宁健康、创业慧 康、嘉和美康等医疗健康企业陆续接入了DeepSeek。比如,2 月 6 日, 智云健康宣布将DeepSeek-R1 模型接入公司自研医疗人工智能系统 “智云大脑 ”,以增强数据挖掘能力,提高数字化慢病管理效率。二 是深圳大学附属华南医院、昆山市第一人民医院和成都市中西医结合 医院(成都市第一人民医院)三家三甲医院已经宣布成功完成了 Deep seek 的本地化部署。其中昆山市第一人民医院-昆山生物医学大数据创新应用实验室主要利用DeepSeek 加速研发行业大模型和智慧 医疗解决方案,推动人工智能技术在医疗场景中的落地与创新。成都市中西医结合医院探索将 DeepSeek 模型融入医院临床营养评估决策支持、治未病诊疗及专科患者随访等多个环节。 53、DeepSeek 在国内金融行业的应用进展如何? 答:DeepSeek正在金融行业快速落地,赋能银行、券商、基金 等金融机构的业务场景,其中券商最为迅速。 (1)券商:华福证券、中信建投证券、国金证券等近 20 家券商 接入 deep seek 大模型或完成本地化部署,主要应用于内部的知识问 答、信息检索、行业研究、市场分析等业务场景。 (2)银行:江苏银行、邮储银行、北京银行等数多家银行完成 DeepSeek 的本地化部署或联网应用,主要应用在智能客服、合同质检、自动化估值对账、信贷风控等场景。 (3)基金:博时基金、汇添富基金、富国基金等 10 余家公募基 金公司进行私有化部署,并开始探索在投资研究、风控合规、客户服 务、软件开发等场景应用。 (4)保险:新华保险、太极华保等已经接入,应用到个人AI助 理、保险营销、客户服务、数据分析等场景,中国平安、水滴筹等正在处于合作及内测阶段。 (5)金融科技服务:恒生电子、金证股份等金融科技服务公司的大模型服务接入了DeepSeek。 54、DeepSeek 在电商行业有哪些主要应用场景? 答: 目前已有多家电商相关平台、企业接入DeepSeek实现智能化场景应用。一是智能客服场景,DeepSeek接入客服系统后可丰富销售话术,提供不间断服务,提升客户体验。如京东智能导购言犀果果通过DeepSeek实现精准销售话术推荐和个性化开场白生成,效率 提升3倍。二是精准营销场景。如AI效果营销平台乘风引擎和京东智能外呼言犀传声利用DeepSeek,根据用户行为和实时市场数据定制营销策略,提高转化率,并生成具有“人味儿”的外呼话术。三是数据分析场景,乘风引擎加载DeepSeek后,能迅速处理复杂数据, 为企业提供及时准确的数据支持,助力市场竞争。 55、DeepSeek 对教育行业会带来什么影响? 答:近期,多家教育公司纷纷拥抱 DeepSeek,如网易有道、学 而思、希沃、云学堂、猿辅导等。DeepSeek 的技术突破给AI在教育 行业应用带来显著提升,实现了从简单工具到智能辅导的转变。如学 而思将 DeepSeek 与自主研发的九章大模型结合,解题过程不再直接 输出答案,可实现模拟数学老师的启发式教学;希沃学习机全系产品 接入 DeepSeek 后学习报告分析、绘本精讲等功能得到显著提升;网 易有道接入 DeepSeek 后,结合其超长思维链,进一步优化了个性化 答疑功能,能够提供更具深度、更强准确性的解题思路,提升了理科 答疑能力。未来,随着 DeepSeek 的开源,单纯依赖AI技术的企业优 势会逐渐减弱,这意味着教育硬件市场的竞争格局将面临重大变革,内容和数据或将会成为教育企业竞争的核心要素。 56、Deep seek 会给传媒行业带来哪些提升? 答:近日,国内多家主流媒体纷纷宣布接入DeepSeek。如大众报业集团大众新闻客户端,江西新闻客户端、山东省互联网传媒集团,福建省广播影视集团等。DeepSeek在传媒行业的应用会带来以下几个方面的提升:一是提升内容生成效能。如川观智媒大模型融合接入DeepSeek,可通过语义分析技术实现跨平台热点追踪,提升了智能摘要等实用功能的生成质量。二是提升新闻客户端交互体验。如封面科技接入deepseek后,其语音助手响应速度提升60%,用户日均停留时长增加28%;三是提升内容审核效率。如封面科技接入deepseek后,敏感信息是被准确率达99.7%,审核响应时间压缩至0.3秒。 57、DeepSeek 在国内 2C 应用的进展如何? 答:2C 应用方面已有搜索引擎、语音助手、办公创作等多个领域加载DeepSeek。搜索引擎方面,已有秘塔搜索、知乎直答、纳米搜索等接入DeepSeek,在全网实时搜索以及高质量知识库基础之上,全面升级推理能力,此外微信搜索上线“AI搜索”功能,正式灰度测试接入DeepSeek。语音助手方面,如华为小艺助手App已经接入 DeepSeek,用户可通过简单的步骤与DeepSeek进行对话。办公创作方面,阅文集团等在线文学平台引入DeepSeek,帮助作者进行文学创作,如优化文笔、构思情节,提升创作效率和作品质量。钉钉、飞书为代表的协同办公软件也纷纷接入DeepSeek,帮助用户提升工作效率。 58、DeepSeek-R1 对推动 Agent 商用存在哪些利弊? 答:DeepSeek-R1 作为开源的强推理模型,将会大大推进Agent的工程化及商用进程。这主要体现在如大大降低了Agent调用大模型API的成本、提升了Agent对任务的深度理解与规划能力,以及丰富了各类中小蒸馏模型的供给等。但也要看到DeepSeek-R1模型性能并没有超越已有的OpenAI o1,存在幻觉率较高的问题,更适合数学、科学、工程、金融和法律等逻辑链条相对清晰的专业场景,同时由于存在推理时延,DeepSeek-R1也不适合时效性要求较高的场景等。 59、哪些手机品牌接入了 DeepSeek? 答: 目前已有多家主流手机品牌官宣接入DeepSeek。2月5 日,华为原生鸿蒙版的小艺助手App率先接入DeepSeek-R1 Beta版,10日升级至正式版并增加联网搜索功能。荣耀2月8 日上午在安卓阵营 首发,上线YOYO智能体商店尝鲜版。随后,oppo、魅族、中兴旗下 努比亚和红魔、vivo先后官宣接入DeepSeek-R1模型。目前,手机 厂商多数采取的都是“AI助手+”方式接入DeepSeek,也就是说, DeepSeek成为各家AI助手可以调用的一款大模型,用户可以在与智能体交流的时候选择通过DeepSeek的模型来生成答案。 60、DeepSeek 上车最新进展如何? 答:2月8-11日,近20 家车企官宣在智能座舱或AI 运营领域与 DeepSeek 深度融合,包括吉利、奇瑞、东风、长城、比亚迪、一汽-大众、长安汽车、上汽通用等。其中东风汽车完成全系列模型接入,如猛士917智能座舱已接入DeepSeek-R1;一汽-大众将其接入新媒体AI 内容运营数字化平台,在 60 多家经销商试点。DeepSeek 在汽车领域的应用场景目前主要集中在座舱系统的人车交互层面,如 吉利利用DeepSeek-R1模型对星睿车控等大模型蒸馏训练,提升智能交互体验;广汽的 ADiGO SENSE 与 DeepSeek-R1 融合,让汽车能更好预见用户需求。
0 阅读:0

哀上李金锐

简介:感谢大家的关注