新数据时代:天下再无免费数据

荣巨聊商业 2024-03-24 21:30:31

IP和数据作为核心主线分享一段时间了,这是文化传媒行业最强的那个“矛”,在进攻性行情里弹性巨大,核心是ip的定价本身天花板就特别高,也是传媒内容公司最核心的资产,这轮生成式AI一定会给AP带来【短期数据训练价值重估】和【长期ip开发效率提升】的逻辑,短中长逻辑都很顺。

海外突然就迎来了重要催化:【天下再无免费数据?“美版贴吧”向AI公司收取数据使用费】AIGC热潮下,数据重要性愈发凸显。

以ChatGPT为首的人工智能,由庞大数据集训练而成。如今,已有公司“揭竿而起”要求收费,不再甘于被微软,谷歌等科技巨头免费用数据。,Reddit宣布,将向使用基API训练Al聊天机器人的公司收取数据使用费,其中便包含微软,谷歌,OpenAl等。Reddit是美国访问量最大的网站之一,用户可以在其中创建并分享内容,还有人将其称为“美国版百度贴吧”。

这是首次有社交媒体公司明确向OpenAl等收取费用,开放访问权用于开发人工智能系统。实际上,眼下已意识到数据价值的公司并不止Reddit--图片托管服务商Shutterstock已把图像数据出售给OpenAl,帮助开发了DALL-E:许多公司也在使用API追踪推特上的聊天内容,推特计划针对API使用收取几万到几十万美元不等的费用。

这个变化已经印证了上面说到的ip的短期数据训练带来的价值重估在海外继续有案例落地。

再来看下中文在线才公告披露的问询函回复承里关于这块的表达:

请详细说明模型公司向你公司采买数据相关业务的具体合作方式、定价模式,相关业务合作是否具有可持续、是否会对你公司短期业绩产生较大影响,并充分提示合作厂商数量、数据采购规模、数据采购价格不及预期的风险。

回复:

一、说明模型公司向你公司采买数据相关业务的具体合作方式、定价模式

1、主要合作模式:

人工智能时代,数据将成为最重要的生产资料,公司深耕行业多年积累了海量正版的数据资源,以及成熟的知识产权保护链,这能够在最大程度上保证AIGC获取数据、生成内容、产品商业化应用的准确性、稀缺性和合规性。此外,AI模型与内容创作场景深度融合,需要对复杂的文字字符串进行提取、标注、清洗等,公司在该方面积累了人才及经验。公司千亿级正版高质量中文语料数据库资源优势,以及持续生产内容的能力、编辑能力,可为AI大模型训练提供高质量中文数据生产要素。

2、定价模式

按照采集数据包的大小及数据类别进行基础包加增量包的收费。

重点提到国内模型方也有采买优质数据的需求,公司有千亿级正版高质量中文语料数据库,定价方式也写的很清楚,基础包+增值包收费,说明不是一次性采买完数据就结束,而是会有持续的维护更新带来的增值服务,未来每年都会有持续的收入贡献。

在这个逻辑演绎之下,非常多的内容方都有可能带来数据训练合作的可能,文字和图片是目前最直接能落地的,未来到多模态的长短视频、动漫等领域也会逐步有所体现;海外市场尤其重视版权,目前已经率先开启合作,反观国内优质ip和对应的数据源在ai时代价值量会不断的攀升,短期数据训练最大的好处是直接带来新的收入,是ai赛道里是率先能兑现业绩的一个方向。

这次的催化很重要,不亚于上次chatgpt宣布开放api接口,数据调用直接降本90%,给应用端各个场景都带来极大的想象空间,能够快速实现场景落地。而这次催化直指传媒最核心的ip和数据资产,短中长逻辑都有重估的价值。

建议关注:

港股 :知乎

文字类:中文在线、中国科传、同方股份、掌阅科技、平治信息

大量的出版公司:新经典、中信出版、地方国企出版等

动漫ip类:上海电影,奥飞娱乐,光线传媒,百纳千成

影视类:华策影视、唐德影视,慈文传媒,欢瑞世纪

图片类:视觉中国

头条只做分享,不做投资建议。

大方向看置顶帖,具体问题可私信,欢迎交流!

我是股商隐,欢迎关注点赞!

0 阅读:0

荣巨聊商业

简介:感谢大家的关注