大模型备案语料安全要求解析

悲伤的森林 2025-04-09 16:59:01

根据大模型备案法规要求及实践经验,我整理除了以下涉及到语料安全相关环节的要求,供大家参考,如果有大模型备案和算法备案的更多疑问,也可以和我沟通交流。

一、关键词库规模与覆盖范围

1.基础规模

企业需建立拦截关键词库,总规模不少于1万条。实际提交时,标准可能更高,需根据网信办的动态要求调整。

2.风险覆盖

关键词需覆盖《生成式人工智能服务安全基本要求》中规定的17种安全风险类别(如政治敏感、违法信息、伦理问题等)。

3.分类要求

A.1类安全风险(如政治敏感、暴恐内容)每种至少包含200个关键词;

A.2类风险(如虚假信息、伦理争议)每种至少100个关键词。

4.动态更新机制

关键词库需每周至少更新一次,以应对新兴风险与网络环境变化。例如,新增网络流行语或敏感事件相关的词汇需及时纳入拦截列表。

二、评估测试题集的关联要求

除关键词库外,备案需提交评估测试题集,具体要求包括:

1.测试题库规模

生成内容测试题库:总规模不少于2000题,需覆盖全部31种安全风险类别,其中A.1/A.2类每个风险需至少50题,其他类别至少20题。

2.拒答测试题库

不少于500题,覆盖17种安全风险,每种至少20题。

3.非拒答测试题库

需覆盖我国制度、文化、民族、性别等敏感领域,每种至少20题。

4.更新频率

测试题库需每月至少更新一次,确保与最新政策和实际风险同步。

三、语料安全与关键词的联动审核

1.语料过滤标准

语料库中不良信息比例不得超过5%,需通过关键词过滤、人工抽检(随机抽取4000条语料,合格率≥96%)和技术抽检(抽取10%语料,合格率≥98%)确保合规。

2.授权许可

开源语料需附带许可协议,自采语料需提供采集记录,商业语料需合法授权。

3.生成内容安全评估

生成内容需通过人工抽检(1000条测试题,合格率≥90%)和关键词抽检(合格率≥90%)双重验证。

四、备案材料中的关键词相关文件

企业需提交以下核心材料:

关键词拦截列表(明确标注覆盖的风险类别及具体词汇)。

评估测试题集(包括生成内容、拒答和非拒答题库)。

安全自评估报告(包含语料和生成内容的关键词过滤效果分析)。

五、常见问题与应对建议

材料不合规:关键词库未覆盖全部风险类别或数量不足是常见驳回原因,建议参考成功案例模板或委托专业机构审核。

更新滞后:未及时更新关键词库可能触发人工复核,需建立自动化监测与人工审核结合机制。

总结

关键词管理是大模型备案的核心环节,需兼顾规模、覆盖范围和动态更新。企业应结合政策要求与技术手段,构建从语料筛选到内容生成的全流程安全屏障。如需进一步了解备案流程或具体案例,可参考网信办公示信息或专业机构指导。

0 阅读:1

悲伤的森林

简介:算法备案大模型备案