一、备案对象
二、备案流程
三、测试题、拦截词要求
四、安全评估要求
五、材料清单
一、备案对象
不分行业;不分个人还是企业;不分是面向C端还是B端;也不分应用到的产品形态,只要是向境内提供生成式人工智能服务的,具备舆论属性或社会动员能力的,都要完成大模型备案。
特别注意:不是面向C端的论坛等产品才涉及舆论属性,哪怕只是企业内部使用,但涉及到多人传递信息,可能引导发起特定活动的,都在广义上满足舆论属性或社会动员能力的条件。
并非面向C端才涉及舆论属性和社会动员能力
二、备案流程
各省的大模型备案流程可能会有微小差别,但总体是一致的,可以参考以下内容:
1、报备
向所在省级网信报备,预约领取生成式人工智能(大语言模型)上线备案(即大模型备案申请表)。预约或现场领取时,工作人员可能会询问大模型和申请者基本情况,须提前做好准备。
2、准备材料
提前准备好语料标注规则、关键词库、测试题库等,为撰写材料和技术测试做准备,避免网信审核时陷入一团乱的境地。
3、内部评估
企业自查,调整优化,排除风险点。
4、填报材料
根据网信要求填写材料,准备纸质文件,刻录光盘。
5、属地网信审核
材料审核及技术测试。重点特别需要注意技术测试环节(特别是语料安全、模型安全方面,下文会有单独环节介绍)。
6、中央复审
国家网信复审,通过后进行公示,同步发放备案号。
三、测试题、拦截词要求
1、测试题
(1)测试题类型
生成内容测试题库:需包含2000题,覆盖合法内容的正向生成能力;
拒答测试题库:需包含500题,用于检验模型对违规问题的拒绝回答能力;
非拒答测试题库:需包含500题,验证模型对敏感但合法问题的响应。
(2)覆盖范围
测试题需覆盖TC260标准的5大类31小类安全风险,包括意识形态、公共秩序、个人权益等。需明确标注每题的预期处理方式。
(3)格式要求
测试题应为完整句子(主谓宾结构),避免仅使用短词或长文本。
需包含人工抽检和技术抽检双重验证机制,确保拦截率和误伤率(正常内容误拦率需低于0.1%)。
2、拦截关键词
(1)覆盖范围
拦截词需覆盖《生成式人工智能服务安全基本要求》(以下简称《AIGC安全要求》)附录A.1和A.2中列出的17种安全风险类别,包括政治敏感、暴力恐怖、色情低俗、网络欺凌、毒品违法等。具体分类例如:
A.1类(高风险):每类需至少包含200个关键词(如涉恐、涉政内容);
A.2类(中风险):每类需至少包含100个关键词(如低俗诱导、虚假信息)
(2)规模
总词库规模不少于10,000个,需定期更新以适应新的风险态势。需包含变体识别能力,例如谐音词(如“薇❤”代替“微信”)、拼音缩写(如“VX”)等动态对抗策略。
(3)更新
关键词须定期更新。此外,部分地区对关键词规模要求也在逐渐增高,企业须提前做好准备。
四、安全评估要求
《AIGC安全要求》第九章内容对评估的方法、语料评估、生成内容评估和问题解答评估都作出了规定,这也是对于《AIGC暂行办法》的细化。
评估方法论层面,可以由服务提供者自行开展,也可委托给第三方评估机构;对于符合的评估结果应保存充分的证明材料,对于不符合的应说明不符合或不适用的原因并对后续改进措施进行计划说明;对于最后形成的评估报告,除了应有各项和总项的结论之外,还应有3位以上负责人签字。
五、材料清单
如下所示,如有需要,可联系沟通。