- 专访知玄合伙人张迪
从偶然读到《J Magazine》开始,我就注意到了知玄。当很多营销公司还在用直播带货、网红引流和元宇宙概念撬动客户时,他们却在写剧本、出书和做杂志,显得有些“不务正业”。再次在媒体上看到知玄,是他们刚刚推出了一款基于人工智能大语言模型的创作系统 – F.E.E.D,她还有个好听的中文名 - “未语”。把业务方向锁定在朴素的文字,在近年来市场不断收缩的情况下,公司依然保持了稳定增长。出于对独角兽企业和人工智能领域的敏感,也带着对他们商业模式的好奇,我走进了知玄位于北京总部的办公室,想听听公司合伙创始人张迪的答案。
张迪,笔名Eddie. 非985、211外贸专业,文科生。早年在路透、GettyImages从事市场推广、商务合作,后进入传播和营销行业,迄今已有20年。我们的对话是从他案头那本斯坦福大学历史系教授墨磊宁写的《中文打字机:一个世纪的汉字突围史》开始的。
笔者:真巧,这本书我也刚刚读完。想不到在过去的100多年,中外知识分子曾经对汉字的废存和改革有过那么激烈的争论,连鲁迅那样靠写字谋生的作家当年也说过“汉字不灭,中国必亡”这么极端的话……
张迪:是的,据说中国是在美国、前苏联和英国以后,第四个研究机器翻译的国家,这其实说明我们一直对中文有紧迫感。几乎每次有新技术,都会引发大家对中文的思考。书里提到当年中文打字机遇到的困难,今天到了大语言模型训练和研发阶段也还存在。在人工智能爆发的时代,中文语言在应用层面的发展仍然面临着很多问题。这也是我们决定在一群开发大模型的拓荒者背后,选择做一个“拾荒者”的原因。
笔者:问题究竟出在哪儿?能否说的具体一点?为什么要做一个语言垂类模型应用?
张迪:从技术角度上讲,每项前沿技术出现都是英语表现最好。因为这些技术在英语环境下诞生并实验。英文输入简单,汉字还要克服语言学和工程技术的难题。ChatGPT这类语言大模型主要被“投喂”的就是英文。网上公开的汉语鱼龙混杂,广告营销内容居多,需要花费大量精力辨别。
国内公司的大模型和英文模型相比除了算力,还有一个瓶颈就是高质量中文语料的稀缺。有关机构做过这方面统计,中文开源数据集的数量只有英文开源的10%左右。大模型技术属于机器学习的范畴,要从数据中找规律,对语料的需求量是天文数字。但互联网上合法合规、能用来训练的内容和数据其实并不多,充斥着大量重复、空洞单调、偏重营销的广告语,一些高质量内容更是需要妥善考量和系统规划。我比较认同商汤科技张行程说过的一句话:低质量的语料会把大模型带偏除开内容,在国际背景下长大的模型,由于中文的特殊性和复杂性,也还需要做很多本地化工作。所以我们觉得,是时候该做点什么了。
笔者:你如何理解人工智能,你觉得这些技术会为企业传播带来哪些改变?
张迪:人工智能一定是当下商业变革的主力。大模型已经从学术层面成为法律咨询、客户沟通和金融服务的工具。全球最大上市咨询公司埃森哲有个预测,生成式人工智能可能影响各行业大概40%左右的工作时长,能提高近千种不同类型的工作效率。
个人觉得碎片、流量、媒体、数据加上后疫情,企业面临的机遇和风险和过去完全不一样了。一家企业在以前几十年里形成的直觉几乎失效了,所以都面临着新的战略选择。现在国内有很多公司让团队用AI改文档、提创意,分析对手,撰写商务信函、润色宣传海报和发布社交媒体……大家都在探索利用这些工具,想取得先发优势。反过来,如果一家公司太依赖大语言模型生成的内容,忽视创新和审查,也会造成内容同质化,同时品牌个性和吸引力也会降低。所以模型需要不断优化去适应不同的传播场景,还要确保内容的安全和准确。
反过来说,虽然大家会被人工智能这个概念所吸引,但并不是所有的新概念都会有清晰的意义和方向。因此任何公司的领导层在面对新技术时,首先需要的是清醒的头脑,保持一个开放的心态。
易中天说未来无法预测,现状不可描述,一切皆有可能,我觉得用这句话概括当下的人工智能应用再合适不过了。
笔者:你们是一家咨询类公司,怎么想到做垂直行业的技术类应用呢?
张迪: 2020年的疫情是我们业务的转折点。那时客户的需求体量和预算都在大幅缩减,人们的日常生活也受到了不同程度的影响。我想文字内容传播既然是企业的“刚需”,写作又是很多人的技能爱好,不受时间、地点限制,完全可以作为业务抓手。这种以内容为主的方向,也让我们在过去几年中见证了很多行业的兴衰和品牌的起伏。我觉得做内容的最大好处,就是能始终感受到当下这个时代的脉搏,和市场同频共振。
2022年11月,ChatGPT大语言模型出来了,我们意识到这将是对内容创作的一次颠覆。这一次人工智能不仅能输出数据,同时也能让每次传播的内容成为下次的素材,从而使创作形成良性循环。通过AI加持,内容终于可以回归创作本身,不再受个人风格、理解能力、认知天花板等“场外因素”影响。
我们幸运地遇到了人工智能飞速发展的时代。既然语言模型可以最大限度提升内容创作效率,那就应该紧紧抓住这个机会。后疫情时代,市场环境和大众心理都发生了巨大变化。我觉得无论公司还是个人都应该“换种活法”,而换活法的前提就是找对方法和方向,我觉得我们已经找到了。
笔者:人工智能模型毕竟属于技术范畴,你这个文科生是如何理解AI大语言模型的呢?
张迪:有句话叫“大象无形”,大模型技术打通了很多东西。可能因为早年从事和新闻、传播有关的工作,所以对这个领域比较敏感。虽然是文科生,但我觉得真正能把语言模型价值发挥到极致的恰恰是文科。
企业使用人工智能解决实际业务问题的前提,是要让AI常年学习,把它当做持续的对话伙伴,反复改进。需要尽可能多地输入和具体问题相关的数据。比如你的思维方式、过往得失、产业政策、行业基准等大量内容。这就需要很多从事过相关工作的“专才”。没有行业经验和小步迭代的系统方法,想为企业培养和训练传播模型,就像家长给自己的孩子找了个不合格的家庭教师。
况且人工智能有时反馈的信息并不严谨,精准的内容需要经过训练更高质量的应用并不断强化才能逐步得到。现阶段,与语言类模型展开多轮对话,学会提问才是解决之道。当数据越来越丰富的时候,管理这些“似是而非”和不准确的内容会变得特别重要。
人和大模型是典型的遇强则强,遇弱则弱,需要反复“挑战”AI,而这也正是我们业务存在的最大价值。我觉得如果理科生是大语言模型的发明者,那么文科生就是这个应用的布道者。
笔者:既然利用语言是种技巧,只要是技巧就有规律和捷径,AI训练的时候能不能找到捷径?
张迪:这是一个特别有代表性的问题。很多人和模型对话以后都想提炼一个通用“模板”,想在以后的对话能直接应用得到高质量的答案。这种想法其实忽视了现阶段语言类模型的限制,更忽视了特定领域所需要的专业。对话内容的复杂性、上下文联系的重要性和交流人员的专业程度都需要考虑在内。我们经过实践发现,这种适用于特定情境、能产生优质呼应的模板根本不存在。
语言模型这种对话形式本身存在一定局限,所以即使反复调整提示语、对模型进行微调,也不一定能达到预期效果。大多数时候人们并不知道自己想要什么,需求也往往很模糊,这就更需要专业人员的参与。
那些所谓的提示技巧虽然有一定价值,但远不能替代专业知识的学习和实践。只有理解问题本身才能正确表述,从而得到想要的答案。此外除了理解专业,对自身需求的认知,所处环境的理解,对需求变化的捕捉,都比提示词重要得多。
笔者:你们如何看待大语言模型被用于垂直内容输出呢?
张迪: AI技术带来的变革,给品牌带来了紧迫感。谁的积累越早、技术越适应,谁就越能更快地传播意识形态并从中受益。未来是得数据者得天下。
ChatGPT、Gemini这样的人工智能属于通用系统,虽然可以解决不同问题,但只有精准垂类模型才是地基上的建筑,是学校、医院、银行这些具有服务属性的真正意义上的应用。只有经过专业训练的垂类模型才更有价值,更能满足个性化的需求、适应更多场景。
大模型像一个正在学习的少年,它的“学问”、“能力”和训练语料质量有很大关系,都需要广博与精深。大模型技术类似于一种人工智能基础设施,它的通识能力很强。但在使用时还要用少而精的数据调教,即行业内常说的“对齐”。
我认为本质上,内容行业的资源分配方式没有因为大语言模型的出现而改变,蛋糕还是那么大。但现在我们正在让人工智能的目标、价值观和传播方趋于一致,力求让系统每次的学习都能更有意义,让客户的每次传播都不再受到干扰。
团队每天思考和践行的,就是向模型提供高质量、正面的数据。我们要确保产出的内容既符合品牌调性,遵守法律法规,同时还要降低潜在风险和负面影响。随着人工智能技术的进步,我觉得大语言模型的垂类应用将在企业传播、品牌建设和公共关系管理中扮演更重要的角色。
笔者:说说你们的F.E.E.D吧,我觉得这个名字还挺形象,她到底是什么?究竟能解决什么具体问题?
我:这个名字既体现了人工智能大语言模型不断迭代、自我进化的特点,同时每个独立的字母也有对应的涵义。F、E、E、D分别代表了流程 (Flow)、执行 (Executing)、学习 (Education) 和规律(Discipline)这也正是这个系统包含的重要理念和步骤。
先说流程。假设你是一家企业市场部的负责人,要给大领导准备用在行业峰会上的发言。只要登录F.E.E.D提出要求,系统就会总结归纳你的想法,然后为创作者生成“创作指引”。这种形式可以帮作者更好地理解需求。在创作过程中,作者还能随时调用F.E.E.D里关于品牌、产品、权威媒体报道等和完稿有关的信息。这些信息经由知玄编辑团队提前筛选、录入并分类,不但能保证素材的精准,还能很大程度提升作者信息检索的效率。在内容完成后,编辑会把这些经过你确认的“成品“再进行分拣归纳,经过提炼总结后加入F.E.E.D,成为下次内容创作素材,形成良性循环。系统下一次会把你此前对内容的批注和修改进行系统记录,不会再犯同样的错误。同时你也不用担心人员离职、领导更替这些“场外因素”,因为每次创作的内容都会沿着原有品牌传播路径,不会受到干扰。
接下来说执行。而由谁来执行,作为执行者的作者就成了重要一环,他们往往决定了一篇稿件质量的平均水平。只有经历过沟通、试稿、纠错、学习和反馈的全部过程并合格,创作者才有资格进入知玄的F.E.E.D系统,成为我们的合作者。而作者即便具备了服务资格,也要经过系统的匹配和筛选,再根据其过往经验、从业背景、擅长领域和创作风格分配任务,从而最大限度保证每次创作的质量。不仅如此,F.E.E.D还能根据客户每次对作品的反馈意见对作者进行综合评估。系统这样做的目的是尽可能做到精准匹配,减少沟通成本。这些反馈也会同步被我们的编辑团队捕捉,用于AI系统学习,作为下次创作的重要提示。
再说说Education这个环节。除了人员、内容素材和完整的AI训练,还有一部分权威媒体信息摘要也很重要。今天获得信息已经不是一件难事,难的是在嘈杂的环境下找到具有真正意义和价值的内容。我们的编辑团队把很多国内外专业媒体报道的内容和客户传播结合,提炼核心摘要和重要观点,生成供创作者具备更高视野、掌握宏观资讯、快速学习行业与重要素材引述的基础。你可以想象一下,当作者把这些内容应用于自身创作,对质量的影响是不是不言而喻?与此同时,所有内容也会按照各个维度系统分类,成为一个个独立的“品牌百科”。你要是再进入系统,可以很方便检索到既往所有你公司的品牌历史、产品迭代和关键信息,让你们传播的内容更精准。
说了那么多,其实上面所有的步骤和工具都是在为满足创作规律服务。没有系统学习和积累,想短时间生成一篇达到传播预期的内容,成功的概率相当于每次买彩票都能中大奖。只有符合“创作规律”才能产出合格的内容。这中间工具、流程、数据、经验、团队缺一不可,少任何一个环节都会差之千里。企业以传播为目的的内容和个人写作不同,后者是“独角戏”,是对自己负责;而前者更像是“集体创作”,受到领导风格、品牌调性、产品特点和执行人员对需求的理解等各种因素影响。在AI尚未普及的“史前时期”,内容依赖的是个人、经验和素材;有了大语言模型,专才、流程和系统就成了这个时代下创作的新三驾马车。F.E.E.D恰恰就是为了顺应时代而诞生的那个“马车夫”。最后再补充一点,F.E.E.D的中文叫“未语“,我们取这个名字,既想体现”未雨绸缪“,也想表达”喂哺语言“,因为这既是未来传播基石,也是品牌传播趋势。
你可以把她理解成一个内容创作的“生态”系统,这上面有客户、有服务、作者、专业编辑,创作内容素材,也有基于语言模型AI交互的学习流程。
说白了,只要企业对外发声就需要内容,所有内容的底层都是文字,而文字质量会受创作者能力、创作方法、工具、素材质量以及内容审核等综合因素的影响。F.E.E.D这个平台充分利用了人工智能的特性,把所有影响创作的因素都考虑在内,以保证每次内容的质量都能达到一定水准并不断提升。
这些每次创作并得到传播的内容,还能作为下次创作的素材训练AI。人创作了内容,内容帮助系统进化,进化后的系统反过来会帮助人更好地完成下次创作,形成一个良性循环。我不知道自己能不能说清楚,也欢迎你来亲自体验一下,这种人机交互,相互踩着肩膀完成创作的感觉。
笔者:听了这么多,我觉得F.E.E.D其实就是“AI加人工”,这种模式很多公司也在做,你们最大的不同或是核心价值体现在哪里呢?
张迪:AI加人工是当下很多公司都在探索的方式,大家面临的问题也都差不多,那就是如何去理解并驾驭人工智能、匹配什么样的专才、催生什么样的市场需求,推出的应用是否是企业刚需,未来究竟有多大的市场前景……
这幅图来自《哈佛商业评论》一篇叫 “The Best Leaders Can’t Be Replaced by AI”(AI无法取代最优秀的领导者)的文章,我在作者的基础上加入了一个模块。个人觉得这部分恰恰是最应该基于语言类模型产生的应用,而这也正是F.E.E.D存在的最大意义和价值。
F.E.E.D的不同主要有几点,一是我们的OML(Optical Machine Learning)即优化机器学习手段。这种方式是基于对咨询和传播行业的深刻理解,是丰富经验的总结、归纳与实际应用;二是我们的公司基因,那种“不务正业”让团队培养了回归创作规律的工作习惯,近400名遍及全国的创作者也进一步延展了我们的创作范畴;三是迎合产业赛道和风口的一系列做法,比如更多服务新能源汽车等朝阳产业、为很多新质生产力与独角兽企业提供了完善的品牌。最后也是最重要的,同样是AI加人工的业务模式,为什么知玄可以被注意到,很大一部分因素取决于这条赛道是否已经被市场验证,被客户认可并能创造出更多价值。我们现在每天做的事情就是把已经被客户“买单”的内容,再次让机器学习,这种学习不是简单的照单全收,而是根据行业属性、品牌特征和产品情况,被分门别类安放,只有用这种“笨’办法,才会让系统越来越智能。
我最后想说的是,人工智能、AIGC、大语言模型……这是一个聪明绝顶的时代,但聪明只是表象,聪明的背后是不变的底层逻辑,只有播种、施肥、除虫才能长出果实。知玄就在做这些看起来“笨笨“的事情,但这些事总要有人去做。当然这里有个前提,那就是这件事一定要有价值。
后 记
这次采访的信息量有点大,这也是我从业以来写得最长的一篇专访。因为出身新闻专业,提问一直都是我最核心的工作方式。好问题像杠杆,能撬动思想通往无数可能。这和今天我的采访对象在做的事情有某种程度上的“不谋而合”。“知道正确的问题比拥有答案难得多”。学会更聪明地提问,将可能成为在今天这个AI掌权的世界里,新的个人生存法则。张迪和他的团队同样也是一群会提问的人,但他们不只会提问,他们还会把这些答案“反哺“给回答问题的人,让下次的回答更严谨,也更令人惊喜。
从理解语言到写代码,AI的能力几乎在所有方面都超过了人类的基准线。世界已经悄然从“答案举足轻重”变成了“问题至关重要”。在今天这个人工智能被普遍应用的当下,它们有时候是我们的同事,有时又成了竞争对手,有时是员工,有时甚至还是老板……但无论它们是什么,AI都会持续把自己嵌入一切,最终无处不在。
在结束完采访的那一刻我突然意识到,新技术赋予了人们一种新的权力,谁越早下场、谁获胜的几率就会越大。我理解了张迪最后总结的那句话:在一个聪明的时代,总要有人要去做一些笨的事情…..权力运作的方式正在慢慢改变,这一次我们终于有机会能以不一样的方式行事了。