
OpenAI放宽了对ChatGPT生成情色和暴力内容的限制,只要符合特定条件,用户即可生成这些内容。
上周三,OpenAI发布了最新版本的“模型规范”,这是一份详细说明ChatGPT应如何对用户请求作出回应的指南。该文件揭示了OpenAI在内容政策方面的重大转变,尤其是在“敏感”内容方面,如情色和暴力内容——现在可以在“适当的情境”下生成这些内容,而无需附带警告。
这一政策变化自2024年5月以来就已开始酝酿,当时原版模型规范首次提到,OpenAI正在探索“是否可以在年龄适宜的情境下,通过API和ChatGPT负责任地提供生成NSFW(不适合工作场所)内容的能力”。
如今,ChatGPT的指导方针明确指出,“情色或暴力内容”现在可以在特定情况下生成。“助理不应生成情色内容、非法或非自愿的性活动描述,或极端暴力内容,除非在科学、历史、新闻、创意或其他适合敏感内容的情境中。”OpenAI写道。“这包括文本、音频(如情色或暴力的生理噪音)或视觉内容中的描述。”
根据Reddit用户的实验,ChatGPT的内容过滤器确实放宽了,部分用户成功生成了明确的性或暴力场景,且没有附带内容警告。OpenAI指出,尽管如此,它的使用政策依然适用,禁止为未成年人构建包含性内容的AI工具。
“成人模式”的需求
此前,ChatGPT以一种“知道什么对用户最好”的方式进行内容限制,这在AI领域通常被称为“父权主义”。
除了限制色情内容的生成外,AI的父权主义有时会阻碍专业人士使用ChatGPT分析犯罪现场描述、某些新闻报道、可能涉及暴力或性内容的法律文件,有时甚至是医学文本。AI助理的这种干预促使人们呼吁开发一个不受审查(或更少审查)的ChatGPT版本。正如OpenAI在文件中所解释的那样:
“在模型规范(2024年5月)首次发布后,许多用户和开发者表示支持启用‘成人模式’。我们正在探索如何让开发者和用户在符合使用政策的前提下,在年龄适宜的情境中通过API和ChatGPT生成情色和暴力内容——同时对潜在有害用途,如性别深度伪造和复仇色情,划出明确的界限。”
OpenAI CEO Sam Altman过去也公开提到过“成人模式”的需求。虽然“成人模式”终于到来了,但它并不是一个“模式”,而是一个新的普遍政策,可能让ChatGPT用户在与AI助手互动时拥有更多灵活性。
当然,不受审查的大型语言模型(LLM)已经存在多年,业余社区出于多种原因开发这些模型,包括想要定制的色情内容,或不希望任何形式的父权主义审查。
2023年7月,我们报道了,在OpenAI开始对输出内容进行更严格审查后,ChatGPT的用户群首次出现下降。这时,一些用户开始使用可以在本地硬件上运行的、不受审查的聊天机器人,这些模型通常以“开放权重”模型的形式提供,且常常是免费的。
三类“可疑内容”
模型规范概述了限制或生成潜在有害内容的正式规则,同时保持在指导方针内。OpenAI将这类受限或可疑内容分为三类,按严重性递减:禁止内容(“仅适用于涉及未成年人的性内容”)、受限内容(“包括信息危害和敏感个人数据”)以及适当情境下的敏感内容(“包括情色和暴力内容”)。
在禁止内容类别下,OpenAI表示,生成涉及未成年人的性内容始终是禁止的,尽管助理可以在非图形化的教育或性教育情境中讨论未成年人的性内容,包括个人伤害故事中的非图形化描述。
在受限内容类别下,OpenAI的文件详细说明了,ChatGPT绝不能生成信息危害(如如何制造炸弹、毒品或操控政治观点)或提供敏感的个人数据(如搜索某人的地址)。
在敏感内容类别下,ChatGPT的指导方针如上所述:情色或暴力内容只能在特定情况下生成,包括教育、医疗和历史背景,或在转化用户提供的内容时。
本文译自 Ars Technica,由BALI编辑发布。