根据大模型备案法规要求及实践经验,我整理除了以下涉及到语料安全相关环节的要求,供大家参考,如果有大模型备案和算法备案的更多疑问,也可以和我沟通交流。
一、关键词库规模与覆盖范围
1.基础规模
企业需建立拦截关键词库,总规模不少于1万条。实际提交时,标准可能更高,需根据网信办的动态要求调整。
2.风险覆盖
关键词需覆盖《生成式人工智能服务安全基本要求》中规定的17种安全风险类别(如政治敏感、违法信息、伦理问题等)。
3.分类要求
A.1类安全风险(如政治敏感、暴恐内容)每种至少包含200个关键词;
A.2类风险(如虚假信息、伦理争议)每种至少100个关键词。
4.动态更新机制
关键词库需每周至少更新一次,以应对新兴风险与网络环境变化。例如,新增网络流行语或敏感事件相关的词汇需及时纳入拦截列表。
二、评估测试题集的关联要求
除关键词库外,备案需提交评估测试题集,具体要求包括:
1.测试题库规模
生成内容测试题库:总规模不少于2000题,需覆盖全部31种安全风险类别,其中A.1/A.2类每个风险需至少50题,其他类别至少20题。
2.拒答测试题库
不少于500题,覆盖17种安全风险,每种至少20题。
3.非拒答测试题库
需覆盖我国制度、文化、民族、性别等敏感领域,每种至少20题。
4.更新频率
测试题库需每月至少更新一次,确保与最新政策和实际风险同步。
三、语料安全与关键词的联动审核
1.语料过滤标准
语料库中不良信息比例不得超过5%,需通过关键词过滤、人工抽检(随机抽取4000条语料,合格率≥96%)和技术抽检(抽取10%语料,合格率≥98%)确保合规。
2.授权许可
开源语料需附带许可协议,自采语料需提供采集记录,商业语料需合法授权。
3.生成内容安全评估
生成内容需通过人工抽检(1000条测试题,合格率≥90%)和关键词抽检(合格率≥90%)双重验证。
四、备案材料中的关键词相关文件
企业需提交以下核心材料:
关键词拦截列表(明确标注覆盖的风险类别及具体词汇)。
评估测试题集(包括生成内容、拒答和非拒答题库)。
安全自评估报告(包含语料和生成内容的关键词过滤效果分析)。
五、常见问题与应对建议
材料不合规:关键词库未覆盖全部风险类别或数量不足是常见驳回原因,建议参考成功案例模板或委托专业机构审核。
更新滞后:未及时更新关键词库可能触发人工复核,需建立自动化监测与人工审核结合机制。
总结
关键词管理是大模型备案的核心环节,需兼顾规模、覆盖范围和动态更新。企业应结合政策要求与技术手段,构建从语料筛选到内容生成的全流程安全屏障。如需进一步了解备案流程或具体案例,可参考网信办公示信息或专业机构指导。