Reddit、推特先后限制AI爬数据,社交媒体公司进入内容变现时代?
【ashkeling专稿,未经授权不得转载!】
ashkeling报道/21世纪伊始,互联网广告、大数据等新兴业务的蓬勃发展让无数公司意识到数据所蕴藏的巨大价值。用户浏览的页面停留时间、内容消费偏好这些看似不起眼的动作,在日积月累中变为宝贵的行为数据,成为用户标签、算法推荐的直接燃料。互联网广告业务的出现,让数据的收集和转卖变成科技公司眼中数十亿级别的好生意。
而AI大语言模型的诞生,似乎将要再次重演这一“变废为宝”的过程。对于国内外各大社交媒体平台产品,一扇全新的商业化大门正在徐徐打开。
近期,社交媒体公司Reddit宣布,该公司将推出一个付费档位的API接口,为有特殊需求的第三方提供额外的能力和更多的调取次数。Reddit的CEO Steve Huffman向纽约时报暗示,做出这一决定的原因是AI公司的崛起:“我们的网站上有很多‘真实的对话’,网站上有很多人们只会在心理治疗或是互助团体中才会说的、甚至从来不会向外人吐露的真心话。我们不会把这些高价值的东西免费提供给大公司们使用。”
这意味着,拥有AI训练需求的科技公司们未来想要抓取Reddit的论坛内容进行学习,就必须向Reddit交上一笔“过路费”。
无独有偶,被埃隆·马斯克收购的推特近期也在大张旗鼓地推广付费API。此前推特曾常年提供免费API接入,而近期,各大品牌的账户不得不支付费用来访问API,部分公司和组织的基本的社交媒体运营甚至都因此受到影响。
其中微软就因不愿支付API使用费用暂停了其旗下广告投放管理平台对推特广告业务的支持。而闻听此言的马斯克更是放下狠话:“他们之前还用推特的数据训练模型呢。该起诉了。”
两大社交媒体巨头下场为自家平台所承载的内容筑起“堡垒”,而不出意外的话,未来也会有越来越多的公司跟进。平台运营方迅速意识到,对于大模型公司来说,社交平台的UGC内容和Getty Images、Shutterstock等商业图库中的内容一样,拥有直接的商业价值,而这一新需求的出现无疑为各大社交媒体平台凭空创造了一笔可以变现的无形资产。
以知乎为例,该平台向来以提供高质量的长图文问答而知名。尽管平台月活破亿、专业类问答内容质量与产量均较高,但知乎始终没有能够找到优秀的变现模式,致使该平台常年处于净亏损的状态。
英伟达此前就通过向Getty Images、Shutterstock支付版税分成的方式达成商业合作。而假如知乎效仿这一模式,采取与大模型公司合作的方式获取分成,那么这无疑相当于将平台上海量的专业内容盘活为优质资产,开辟了全新的变现渠道。此外,微博、小红书、豆瓣等平台均有不小的文字内容积累。这些均具有可变现的潜力。
在这种模式下,社交媒体公司也会拥有主动提升平台内容质量的利益动机,因为内容的质量将与变现效果直接挂钩。例如,社交媒体平台可将这些分成进行YouTube式的二次分配,打造出“发帖赚钱”模式(post-to-earn),通过创作激励鼓励创作者进行更多优质内容的产出。
从理论上,这是一幅多方共赢的理想图景:大模型公司获得更优质的数据,创作者获得物质奖励,消费者获得更高质量的内容和更好用的大模型产品。
不过,这一模式也埋下了版权上的隐忧。目前的主流社交平台(如Reddit、知乎、推特等等)均在用户协议中规定,内容的著作权归发帖人所有,但用户同时向平台方提供授权,允许平台对用户创作内容面向全球进行分发、复制、改编等。而将用户内容“销售”给其它平台进行变现是否能被算作在授权范围之中,这一点还需要通过未来的法律判例进行磨合。
如若转载,请注明出处:http://www.ashkeling.com/2023/04/515788