DeepSeek新专利公布:减少数据采集时网络资源消耗

惟恒知识产权 2025-04-16 17:33:31

国家知识产权局近日公布了深度求索公司的一项突破性专利——"广度数据采集方法及其系统"。这项技术创新通过优化数据采集流程,显著降低了网络资源消耗,为人工智能训练数据的获取提供了更高效的解决方案。

该专利技术的核心在于其创新的分布式采集架构。系统采用智能节点调度算法,能够根据数据源特征自动选择最优采集路径,避免传统爬虫技术的冗余访问问题。测试数据显示,新技术可将数据采集过程中的网络带宽占用降低40%以上,服务器负载减少35%,同时保持数据完整性和时效性。

技术实现方面,深度求索团队攻克了多个关键难题。首先是开发了动态优先级评估模型,实时判断不同数据源的价值密度,优先采集高价值信息;其次是设计了自适应流量控制机制,根据网络状况智能调整采集强度;最重要的是创新性地引入边缘计算架构,将部分数据处理任务下放到采集节点,大幅减少中心服务器的压力。

与传统数据采集方式相比,这项技术具有三大显著优势:网络资源利用率提升明显,相同数据量的采集时间缩短30%;对目标网站的影响降至最低,符合网络伦理规范;系统扩展性更强,能够快速适应不同规模的数据采集需求。这些特点使其特别适合大规模AI训练数据的获取。

专利文件显示,该技术已成功应用于DeepSeek多个产品的数据采集环节。在实际应用中,系统展现出出色的稳定性,即使在复杂网络环境下也能保持90%以上的采集成功率。同时,其智能节流功能确保不会对数据源服务器造成过载风险,体现了技术团队对网络生态的责任意识。

行业专家指出,这项专利的取得标志着中国AI企业在基础技术领域的创新能力。随着大模型训练对数据需求的爆发式增长,高效、合规的数据采集技术正成为核心竞争力。深度求索的这项突破,解决了自身发展需求,也为行业提供了可借鉴的技术方案。

从技术发展来看,这项专利反映了AI数据采集领域的几个重要趋势:从粗放式采集转向精准化获取,从中心化处理转向分布式计算,从单纯追求数量转向质量与效率并重。这些转变将推动AI数据基础设施向更可持续的方向发展。

深度求索技术负责人表示,公司将持续优化数据采集技术,下一步重点提升对多模态数据的支持能力,并进一步降低能源消耗。随着技术的迭代,未来有望实现数据采集过程的碳足迹降低50%以上,为绿色AI发展贡献力量。

来源:科技蜜

0 阅读:14

惟恒知识产权

简介:助力企业:项目申报、知识产权确权,用权,维权。