一、语料安全不合规
1、语料来源未合法授权
语料需确保来源合法,包括开源协议、商业授权或自采数据的合规性。若语料中包含未授权的版权内容(如使用他人知识产权作品作为训练数据),或涉及未获授权的个人信息,将直接导致备案被驳回。
示例:某企业因训练语料中使用未经授权的动漫形象(如奥特曼),生成内容与版权作品高度相似,被判定侵犯知识产权。
2、违法不良信息比例超标
根据《生成式人工智能服务安全基本要求》,若语料中违法不良信息比例超过5%,该批次语料需作废。若企业在采集前未严格评估或采集后未核验,可能导致备案失败。
3、语料标注规则不完善
标注规则需覆盖标注目标、方法、质量指标等,且标注人员需经过培训和考核。若标注内容准确性不足或未建立审核机制,可能因标注质量问题被驳回。
二、模型生成内容存在安全风险
1、生成内容违反法律法规
模型需对用户输入进行安全检测,避免生成涉黄、涉暴、涉政敏感内容。若未建立关键词过滤、分类模型拦截或人工监看机制,生成内容可能触发安全风险。
示例:用户输入诱导性问题时,模型生成违法回答,或未设置拒答机制,均会被视为安全隐患。
2、生成内容准确性不足
例如在医疗、金融领域,若模型生成的诊断建议或投资分析存在误导性、不符合科学常识或现行法规,可能因准确性不足被驳回。
(将算法备案和大模型备案流程搞错)
三、备案材料不完整或不合规
1、核心材料缺失或错误
必备材料如《算法安全自评估报告》《落实算法安全主体责任基本情况》需详细说明算法原理、数据合规性、安全措施等。若报告内容不完整(如未覆盖160+备案指标)、逻辑不清或关键问题未回答,将直接导致驳回。
难点:部分企业因缺乏专业团队支持,难以准确撰写技术性材料。
2、证明材料不清晰
营业执照、法定代表人身份证等证件扫描件模糊,或算法安全负责人的工作证明缺失,均可能因材料真实性存疑被驳回。
四、主体信息不一致或真实性不足
1、备案主体与域名/语料所有者不一致
若企业主体信息(如名称、证件号码)与域名持有者、语料提供方不一致,或法定代表人信息错误,可能触发备案主体核验失败。
示例:使用境外主体或关联公司信息提交备案,但未提供合法授权证明。
2、联系方式不真实
管局可能通过电话核查备案联系人,若电话无法接通、非本人接听,或同一号码关联多个备案主体,将被视为虚假信息。
五、安全措施不达标
1、未建立用户数据管理机制
例如未提供便捷的“关闭数据训练”功能(操作路径超过四次点击),或未明确告知用户数据使用范围,均可能因违反透明度要求被驳回。
2、供应链安全风险
使用未备案的第三方基础模型(如境外模型),或未对芯片、算力等供应链环节进行合规审查,可能因供应链风险被驳回。
六、其他特殊原因
1、行业限制
医疗健康、金融等敏感行业暂无法申请大模型备案,仅支持登记备案。若企业强行提交,将被直接驳回。
2、属地初审未通过
属地网信办在初审阶段可能因材料逻辑矛盾、安全评估不充分或未征求主管部门意见而驳回申请。
规避建议
提前规划合规流程:组建跨部门团队(技术、法务、合规)协作准备材料,确保语料来源、标注规则、安全措施符合《AIGC安全要求》。
持续监控语料与模型:定期抽检语料合法性,优化模型拦截机制,避免生成内容风险。
咨询专业机构:针对材料撰写难点(如《算法安全自评估报告》),可寻求第三方合规服务支持