很多行业内专业人士认为deepseek采用了蒸馏技术,据路透社报道,白宫人工智能专家称有“大量证据”表明DeepSeek使用了“蒸馏”技术来构建其人工智能模型。OpenAI也表示,他们知道中国的公司和其他机构“一直在试图蒸馏美国领先的人工智能公司的模型”。 但是,由于DeepSeek的训练数据并不公开,OpenAI难以证明DeepSeek违规使用了蒸馏技术。AI专家在对DeepSeek R1的分析中提到,存在从R1到Llama和Qwen的知识蒸馏,以增强后续模型的推理能力,但这并不能直接说明DeepSeek在自身训练中一定采用了蒸馏技术。
评论列表