请选择 进入手机版 | 继续访问电脑版
×
首页 首页 自媒体入驻 罗超 查看内容  

用户协议被怼,微博对第三方抓取为何如此忌惮?

本文作者:peanut 2017-9-17 15:16 0 条评论
昨晚,微博用户协议更新被用户怒怼一事,被部分媒体评价为是微博2017年最大的公关危机。互联网用户协议一直都是神奇的存在:没什么人看,却每个互联网平台都有、每个人都表 ...

昨晚,微博用户协议更新被用户怒怼一事,被部分媒体评价为是微博2017年最大的公关危机。互联网用户协议一直都是神奇的存在:没什么人看,却每个互联网平台都有、每个人都表示同意。9月15日晚上,被网友扒出的微博用户协议条款引发一些内容创业者注意,被媒体报道后引发用户不满,甚至误解,更有人说,微博此举是想要“空手套版权”。那么,事实究竟是怎样的?

微博遭遇公关危机只因用户协议语焉不详?

引发用户不满的内容位于新版用户协议1.3条中:

“用户同意不可撤销授权微博平台作为内容的独家发布平台。用户所发表的微博内容仅在微博平台上予以独家展示,未经微博平台事先书面许可,用户不得自行或授权第三方以任何形式直接或间接使用微博内容”。

从字面意义来看,独家发布、独家展示、不得给第三方等词汇,很容易让用户联想到,“我在微博发布的内容,就不能被更新到其他平台了”,这不就变相明确了用户在微博发布的内容的版权是属于微博且是独家吗?在此之前,全球范围内,都从来没有一家UGC/PGC内容平台有这样的要求,因此,内容创作者怒怼微博“空手套版权”就可以理解了。

斟酌微博新版协议不难发现,其最大的问题是将简单的事情复杂化了,没说清楚,产生误解。在我看来,微博用户协议新增的要求很简单,就是“禁止用户授权第三方平台从微博上抓取内容”。

一个自媒体写了一篇原创文章,其版权一定是属于自媒体,他可以将这篇文章更新到多个平台(现实也是“一处水源供全球”),这是微博无权干涉的。但一个自媒体写了一篇文章且更新到了微博,微博有权对这条内容,准确地说是位于微博平台上的内容的使用作出限制,比如禁止用户授权第三方平台来抓取。具体哪些方式属于非法抓取,下面会有介绍。

意识到这个问题后,微博第一时间对用户协议进行了更新,删掉了1.3和1.5的部分内容,根据36kr报道,其主要删除内容是 “用户同意不可撤销地授权微博平台作为微博内容的独家平台”,及强调微博为用户内容的“独家展示”以及索赔款项归微博平台反文旁虫立所有等内容,最受争议的“用户不得自行授权任何第三方使用微博内容”仍在协议中保留。

9月16日下午3:00,微博再次做出紧急回应,明确“用户不得自行授权任何第三方使用微博内容”不会影响用户的著作权和版权,用户可以根据自己的意愿自行更新到其他平台,但“未经微博平台同意,自行授权、允许、协助第三方非法抓取已发布的微博内容,显然是不能允许的。非法抓取是指采用程序或者非正常浏览等技术手段获取内容数据的行为。”

说到最后,一次存续已久的用户协议更新、两次紧急回应、一次协议版本调整,不过还是在说最初要表达的意思:“禁止用户授权允许第三方来抓取自己的微博内容”。微博用户协议是否会再次结合最新声明进行调整避免误会还有待观察。互联网用户协议尽管没多少人看,但做出来初衷还是给用户看的,互联网公司还是要尽量将复杂的法律文书语言,深入浅出地翻译给读者(这似乎是用户体验部负责的事),避免出现类似的被误解。

微博禁止第三方平台抓取内容是未雨绸缪?

微博大动干戈修改用户协议,无非是要在协议层面上不同意用户授权第三方平台抓取内容,这样做的目的是什么?答案自然是:因为有第三方平台想要这样做。

我很早之前曾提出过一个观点,手机百度、微博、今日头条、网易甚至知乎等平台,正在变得越来越像,它们本质上都是内容分发平台,且向彼此领域渗透,内容分发平台最重要的自然是源源不断的内容供给,眼下不同内容平台间内容争夺十分激烈。主流的方式有几个:

1、出钱挖对手的创作者来自己的平台生产独家内容;

2、出钱与对手平台的创作者签订协议,争取独家、首发或同步权;

3、通过补贴政策等计划孵化平台上的创作者成长为优质内容创作者。

理论上来说,这三种方式都还是很尊重原创作者内容权的。不过,这三种方式都只适合PGC,不适合UGC。要一个大V或者中V每天几十条的碎片化内容到多个平台,本身就是一个很烦的事。现在这样的平台除了微博,还有今日头条微头条和知乎日前推出的“想法”。且不出所料,看到微博通过信息流做内容分发的思路在最近一年多成效显著,成为增速最快的中概股,不少内容平台还会推出类似的短信息流产品,再次掀起曾经的“微博大战”(感觉腾讯微博放弃得有点早了)。

这些平台如果只是采取挖大V、签大V的方式来获取信息流内容的方式,内容丰富度远远不及微博,微博又已形成平台效应,粉丝关系和用户基数意味着大多数用户一定会将微博当成首选。后来的平台要丰富内容怎么办呢?通过技术手段,将微博上的内容同步过来,实现微博有的内容我都有,这种做法,微博不得不防。

而且,如果第三方平台通过技术手段,成功抓取到UGC的内容,那么理论上用户社交关系、个人资料等数据都可能被抓取和复制,这是微博的基础底层数据,就像微信关系链一样,微博显然是不会允许这样的事发生的,现在想方设法将抓取UGC内容的念想都给断了。

不久之前,今日头条宣布可“提供技术能力”,授权用户将其他社交平台包括微博的内容同步更新到“微头条”上。微博在第一时间就做出了反应,切断了今日头条的第三方接口,并作出声明:“某第三方新闻平台在微博毫不知情、并未授权的情况下直接从微博抓取自媒体账号的内容,鉴于其行为性质严重,微博先行暂停了第三方接口,并表示将会依法维权。”

这次修改用户协议,看来主要还是微博防范第三方平台抓取内容的未雨绸缪。

通过修改用户协议能防范第三方平台抓取吗?

微博不希望任何第三方平台抓取自己平台上的内容,而后来的平台则想方设法要同步微博内容。这个矛盾的一个可能解决办法就是:第三方平台通过技术手段强制抓取微博内容。

之前确实有客户端这样做了。2014年8月微博和脉脉公开闹掰,微博宣布停止脉脉使用的微博开放平台所有接口,理由是“脉脉通过恶意抓取行为获得并使用了未经微博用户授权的档案数据,违反微博开放平台的开发者协议”,脉脉宣布停止微博登录;

2015年3月,微博主体公司将脉脉主体公司告上法庭,起诉理由之一就是脉脉非法获取和使用微博信息;

去年,海淀法院认定脉脉非法抓取、使用微博用户信息行为构成不正当竞争,一审判决脉脉停止不正当竞争行为,并赔偿原告经济损失等220余万元。

事实上,类似的案例近年来已越来越多。百度起诉360违反Robots协议抓取知道、百科等数据的纠纷就是这样的情况,法院尊重Robots协议和平台对UGC数据的权益,360被判赔偿百度70万元。再比如百度地图和大众点评的纠纷,百度地图因为抓取大众点评商家点评信息也构成不正当竞争,2016年被判赔偿323万,近日二审维持原判。

这些判决表明,属于行业规约的Robots协议或者API协议,是受法律保护的,如果违背平台意愿强制抓取,不论这些内容版权/著作权属于谁都涉嫌不正当竞争。

有人对此不理解。因为,不论是百度知道、百科、还是大众点评的数据,都是UGC的,理论上这些数据版权应该属于用户,凭什么可以禁止第三方平台抓取呢?核心逻辑在于,平台搭建投入运营、技术和人力成本,拥有对数据的使用权和分发权,而且数据就是互联网公司的核心资产,平台对于用户上传的数据的所有权、使用权和分发权毋庸置疑(注意,用户把文章发到微博,版权和著作权与微博无关,但这篇文章在技术层面的数据,属于微博。)如果第三方网站违背意愿抓取数据,就可能被判为不正当竞争。

正是因为担心这样的法律风险,所以一些想要采取技术手段进行“强制抓取”的平台就有了一个新的idea,就是获得用户授权再进行抓取:你在第三方平台上创作的内容版权属于你,那么你可以授权我使用你的内容,但你又不愿意去更新,所以请授权我去抓取你的内容,这样似乎就没法律风险了。

微博看到这个逻辑,因此采取从协议层面来禁止用户授权,以消灭第三方平台强制抓取的合法性。微博的逻辑是:内容版权是属于你的,但平台是我的,你手工将内容分发到一堆平台都与我无关,但你无权让第三方来抓取你位于平台的内容,第三方想要合法抓取微博内容,除了征得微博同意之外,没有任何新的方法。

微博这个要求,至少抛出了一个难题给觊觎其数据的玩家。内容版权属于用户是毋庸置疑的,理论上来说用户可以授权任何第三方以任何合法方式使用自己的内容,但第三方平台通过技术手段抓取,究竟是抓取的用户内容,还是微博的数据?实际上,两者都是,就算第三方平台获得了用户授权,没获得微博授权还是存在法律风险,而且现在微博还争取在协议层面限制用户授权给第三方平台,看样子是希望断了第三方平台通过技术手段抓取微博数据的念想。

作者:罗超(微信ID:luochaotmt)

作者简介:罗超,是虎嗅网年度作者,wemedia联盟早期成员,百度百家首批成员。

本站(360互动新媒体运营网)由罗超授权发布,转载请联系作者授权并注明出处。


鲜花

握手

雷人

路过

鸡蛋

最新评论(0)

相关阅读

Archiver|手机版|小黑屋|网站地图|新媒体交流群:228079389|360互动新媒体网 ( 沪ICP备14023467号-1   

© 2014-2017 360互动新媒体网 Powered by 360hudong.com X3.2

QQ