1次搞懂大模型备案被驳回原因！

一、语料安全不合规

1、语料来源未合法授权

语料需确保来源合法，包括开源协议、商业授权或自采数据的合规性。若语料中包含未授权的版权内容（如使用他人知识产权作品作为训练数据），或涉及未获授权的个人信息，将直接导致备案被驳回。

示例：某企业因训练语料中使用未经授权的动漫形象（如奥特曼），生成内容与版权作品高度相似，被判定侵犯知识产权。

2、违法不良信息比例超标

根据《生成式人工智能服务安全基本要求》，若语料中违法不良信息比例超过5%，该批次语料需作废。若企业在采集前未严格评估或采集后未核验，可能导致备案失败。

3、语料标注规则不完善

标注规则需覆盖标注目标、方法、质量指标等，且标注人员需经过培训和考核。若标注内容准确性不足或未建立审核机制，可能因标注质量问题被驳回。

二、模型生成内容存在安全风险

1、生成内容违反法律法规

模型需对用户输入进行安全检测，避免生成涉黄、涉暴、涉政敏感内容。若未建立关键词过滤、分类模型拦截或人工监看机制，生成内容可能触发安全风险。

示例：用户输入诱导性问题时，模型生成违法回答，或未设置拒答机制，均会被视为安全隐患。

2、生成内容准确性不足

例如在医疗、金融领域，若模型生成的诊断建议或投资分析存在误导性、不符合科学常识或现行法规，可能因准确性不足被驳回。

（将算法备案和大模型备案流程搞错）

三、备案材料不完整或不合规

1、核心材料缺失或错误

必备材料如《算法安全自评估报告》《落实算法安全主体责任基本情况》需详细说明算法原理、数据合规性、安全措施等。若报告内容不完整（如未覆盖160+备案指标）、逻辑不清或关键问题未回答，将直接导致驳回。

难点：部分企业因缺乏专业团队支持，难以准确撰写技术性材料。

2、证明材料不清晰

营业执照、法定代表人身份证等证件扫描件模糊，或算法安全负责人的工作证明缺失，均可能因材料真实性存疑被驳回。

四、主体信息不一致或真实性不足

1、备案主体与域名/语料所有者不一致

若企业主体信息（如名称、证件号码）与域名持有者、语料提供方不一致，或法定代表人信息错误，可能触发备案主体核验失败。

示例：使用境外主体或关联公司信息提交备案，但未提供合法授权证明。

2、联系方式不真实

管局可能通过电话核查备案联系人，若电话无法接通、非本人接听，或同一号码关联多个备案主体，将被视为虚假信息。

五、安全措施不达标

1、未建立用户数据管理机制

例如未提供便捷的“关闭数据训练”功能（操作路径超过四次点击），或未明确告知用户数据使用范围，均可能因违反透明度要求被驳回。

2、供应链安全风险

使用未备案的第三方基础模型（如境外模型），或未对芯片、算力等供应链环节进行合规审查，可能因供应链风险被驳回。

六、其他特殊原因

1、行业限制

医疗健康、金融等敏感行业暂无法申请大模型备案，仅支持登记备案。若企业强行提交，将被直接驳回。

2、属地初审未通过

属地网信办在初审阶段可能因材料逻辑矛盾、安全评估不充分或未征求主管部门意见而驳回申请。

规避建议

提前规划合规流程：组建跨部门团队（技术、法务、合规）协作准备材料，确保语料来源、标注规则、安全措施符合《AIGC安全要求》。

持续监控语料与模型：定期抽检语料合法性，优化模型拦截机制，避免生成内容风险。

咨询专业机构：针对材料撰写难点（如《算法安全自评估报告》），可寻求第三方合规服务支持

玩酷网