财新传媒
位置:博客 > 刘兴亮 > 数据战争

数据战争

亮三点07期:数据战争
 

足球比赛中有个术语,叫做「同城德比」,说的是同一座城市的两支球队之间的比赛。比如在英格兰曼彻斯特,有曼联和曼城;在西班牙的马德里,有皇家马德里和马德里竞技;在意大利的米兰,有AC米兰和国际米兰。

 

每到同城德比,场面都比较火爆,球场上座率都非常的高。

 

在深圳,被誉为最了不起的两家公司——华为和腾讯,也玩起了「同城德比」,而且动静很大,竟惊动了工信部。

 

是什么,让两家牛逼哄哄的公司产生这么大的争端?

 

答案是数据。

 

掀起江湖风浪的不是产品,不是市场,也不是口水战,而是数据。

 

联想到前不久发生的顺丰菜鸟之争、京东天天之争,剧情原来都是神一般的相似,所有的剧情不过是为了同一样东西——数据。

 

数据,成了时下炙手可热的东西。想当年,有「洛阳纸贵」的景象;看今朝,数据已成为江湖大佬必争之物,堪比「洛阳纸」。

 

这期节目,我们就来说说数据战争,且听我来亮三点:左一点、右一点、下一点。

 

左一点:数据战争打的什么仗?

 

有一本书,叫做《货币战争》,火了很多年。我没看,但我喜欢这个书名。

 

过去的一百多年,主宰世界经济秩序的,货币是其中之一。掌握了强势的货币,在国际上就有强大的话语权,比如美国。君不见,美联储的风吹草动,都会世界经济闻风而动。美联储说要量化宽松,世界立即露出笑脸;美联储说要退出量化宽松,世界立即阴云密布。

 

如今的数据,还真有点货币的影子。不然,同处一城的两家巨头也不致于为了争夺数据而撕破脸皮,公开叫板了。

 

在即将到来的智能时代,大数据和云计算一起,成为人工智能的基础设施。人工智能绝对不是仅仅靠一堆算法和一堆服务器就能搞起来,没有数据,人工智能就没有输入,自然也就不会有输出。

 

可以说,缺少了数据的人工智能只能是一个躯壳,不可能有灵魂,所有的算法,都只能停留在算法阶段,无法变为现实。况且,机器学习和深度学习都需要大量的数据样本。

 

因此,各大公司都不惜代价来获取数据。华为和腾讯之争,正是因此而起,顺丰菜鸟,京东天天亦是如此。

 

数据,正成为兵家必争之物,如同互联网江湖的流量、用户。尤其是用户数据。

 

如今,在用户数据的争夺上,各家有各自的地盘。比如腾讯的社交数据,阿里的消费数据,百度的搜索数据,京东的电商数据,各大快递公司的物流数据......

 

各家一方面为自己的数据设立「围墙」,防止他人来抢数据;另一方面又千方百计的从别人那里获取数据,充实自己数据的维度。

 

在华为腾讯的剧情里,腾讯拥有10亿级用户的社交数据,建立了庞大的「数据帝国」,而华为作为终端生产厂家,虽然拥有用户的手机使用方面的数据,但是对于在用户在应用方面的比如社交,电商,搜索的数据,都是欠缺的。而这种欠缺,将阻碍华为在人工智能方面的步伐。

 

所以,华为对于社交,电商,搜索,生活消费领域的数据的喜爱程度,可谓「如饥似渴」。

 

对于华为手机和腾讯之间的关系,有人这样形容:华为就像是一栋写字楼和物业,腾讯就像是写字楼里的一家公司,公司里的人进出大楼,穿什么衣服拎什么包包,物业难道会不知道吗?

 

这不,“物业”行动了。华为旗下的荣耀Magic智能手机的一个新功能,可以通过收集用户活动信息,来提供人工智能服务,例如,基于用户的微信内容推荐餐厅。而信息的来源包括微信、支付宝等多个热门应用。

 

腾讯说,华为动了他们的「奶酪」,所以,腾讯向监管部门投诉了华为。

我计划写本书,书名就叫做《数据战争》。

 

 

右一点:数据是谁的数据?

 

腾讯说:华为不仅在获取腾讯的数据,还侵犯了微信用户的隐私。腾讯还说:腾讯将保护用户的隐私和数据信息,并与电信运营商、手机制造商、应用程序开发人员以及监管机构等、共同建立一个健康的生态系统。

 

而华为是这么回应的:荣耀Magic获取的数据都经过了用户授权,只有用户通过设置以后公司才能收集到数据。而且所有的数据都应该属于用户,而不是腾讯或者荣耀Magic。

 

仔细分析两家的言论,有一个巨大的疑问:数据到底属于谁?

 

腾讯一方显然认为数据属于腾讯,认为华为「获取」腾讯的数据。

这有点像搜索引擎爬虫技术所遵循的Robots行业协议,目录中写明不允许搜索引擎抓取的,即便技术能够实现,即便网页上的权利主体——淘宝网的网店店主同意,如果淘宝平台不同意,百度同样不能抓取这些淘宝店的商品信息。

没错,这就是曾经引发巨大争议的“淘宝屏蔽百度”事件,那是遥远的2008年,但后来证明,淘宝的“霸道”行为为自己赢得了生存机遇,否则无论如何也构建不了海量店家和海量用户的网购闭环。

而华为一方认为数据既不应该属于腾讯,也不属于荣耀手机,而属于「用户」。

 

看起来,两方说的都有道理。

 

微信社交数据,都存在腾讯的机房里。如果说这些数据不属于腾讯,似乎也说不过去。同理,淘宝的电商数据,属于不属于阿里?百度的搜索数据,属于不属于百度?

 

但是华为说,数据属于用户。这个,作为一个手机用户,我也拍掌叫好。我的聊天记录,我在朋友圈发的分享,点赞,评论,如果说不属于我,我觉得是否有必要拼命。

最可怜的其实就是我们用户了。但我们是哑巴吃黄连——有苦说不出。华为说的对,我们确实是「授权」了。我们在注册每一个网站、每一个APP的时候,这些网站和APP都有个格式文本,有常常的协议,通常都有四五页的样子,我们都不看,都是直接拉到底部,点击「确认」。

这下好了,我们用户的数据都被别人拿走了,就好像我们被人给脱的光光的,别人还说,这是我们授权的。被脱光光的,还是自己授权的?去哪儿说理去?

据说,北京最近在推「共有产权房」,一下子将「共有产权」这个词炒火了。

 

难道这数据也属于「共有产权」?

 

纵观这些关于数据的争端,都存在一个共同之处,就是对数据的边界,数据的所有权,使用权缺乏一个统一的共识。因而,结果就是「公说公有理,婆说婆有理」,争论不休,最后也争不出一个结果,只能靠监管部门来调停。

 

以前,数据也是无处不在,但是因为价值不大,所以也没人把它当回事。就像我们每日呼吸的空气,绝对不会有人去想这些空气有什么边界,所有权归谁,谁享有使用权。

 

但是如今,数据成为一个标的物,成为一种无形的财产,自然再也不能把它视为空气,需要思考一下它的边界在哪,它的所有权归谁,它的使用权归谁。

 

华为和腾讯之争已经掀开了这个盖子,所以对于数据的这些属性的界定已经到了刻不容缓的时候了,否则,这样的事情解决了一桩,一定还会出现另一桩,「按下葫芦,起了瓢」。

 

作为消费者,当然觉得数据属于自己,拿社交数据来说,觉得这是属于个人隐私,属于神圣不可侵犯之列。谁侵犯了我的隐私,我跟谁急。

 

如果说道数据边界,我觉得属于个人隐私的部分,绝对不可以让他人查看,更加别说使用了。即使授权了,也能在授权的范围内使用。任何数据的采集都必须经过我个人的授权允许,否则就是「窃取」,就是违法。

 

作为腾讯,当然觉得数据属于自己。前面也说过,存在腾讯的机房的数据磁盘上,作为磁盘的内容,似乎就应该属于腾讯。

 

华为作为终端手机生产商,用户用华为手机,授权华为使用他的数据,使用数据似乎也是天经地义。

 

这样看下来,每一方都站在自己的角度和立场上思考问题,当然不能正确的判断。

 

而在我看来,对于数据这样一种由用户触发,在终端设备上产生,然后存储于应用服务商的存储器上的物品,其实是一种特殊的物种。它不同于我们平常的所见的有形的衣服,私家车,房屋等物品,也不同于专利,创意,文学作品这种无形的知识产权。

 

往细了说,它是比特流;往大了说,它是资产,而且是流动的资产。

 

这种物种通过流动不断产生价值。

 

首先,它的生产者,也就是用户,毫无疑问,拥有第一产权,如果涉及到用户隐私的,应用服务提供商有义务对其加密。

 

然后,当它在上层的应用和底层的终端硬件中流动时,如果没有用户授权,一切采集行为都是「偷窃」。

 

最后,即使是存储在应用服务提供商的服务器上,应用服务提供商也只能在不侵犯用户隐私的情况下有限度的使用数据。

 

同时,对于哪些属于个人隐私,需要一个明确的界定。

 

在数据的流动过程中,虽然数据的位置发生了变化,但是所有者并没有发生变化,除了用户之外,其他人都只有使用权。如果用户授权,则发生使用权的转移或者共享,并不发生所有权的变化。

 

那么,问题来了,应用服务提供商要叫屈了,你那么多数据免费放在我的服务器上,占用我的资源,我不是亏死了?这样也不太合理啊?

 

问题是,谁叫你免费呢?如果你觉得可以,你可以收费。当然,如果你觉得不经济,还可以删除之。

 

如果这些清楚了,那么就没什么好争的了。

 

 

下一点:数据谁来保护,怎么保护?

 

有网友调侃说,你在微信勾搭小三的记录,除了你老婆不知道以外,腾讯华为搜狗输入法高德地图百度网盘360手机卫士大家都知道了。

 

虽然只是一句调侃,但是细思极恐。大数据时代来临,数据量越来越大,数据的生产,转移,存储,使用越来越频繁,对经济和社会产生了新的挑战。前面提到的顺丰菜鸟,京东天天,华为腾讯之争,莫不是这种新时代下的新冲突。

 

只是解决一个个争议事件,依靠行政的力量,只是治标不治本。

 

更需要的是从上层建筑的层面,比如立法的角度来明晰数据的边界,产权,使用权,提供规范性的指导意见,让个人,企业,政府产生共识,明确各自的责权利,从而有法可依,有法必依,依法行事。

 

可惜的是,现行的立法,对于数据这些方面,尚不甚完善。

 

在这方面,欧美已经走在了前面。比如,欧盟已通过《数据保护总规》,2018年正式生效,明确了数据的被遗忘权、更正权、限制处理权、数据可携权、数据获取权、信息知情权、知情同意权等规则和企业设立数据保护官、通知、限制用户画像、限制随意跨境转移等义务。

 

美国白宫两度发布大数据报告,探讨大数据时代的数据保护及数据伦理,推动个人数据保护综合性立法,推动个人数据保护领域性立法,并颁布个人数据保护操作指南。

 

《权利的游戏》里最广为流传的一句话是「凛冬将至」。其实,对于我们来说,倒不是「凛冬将至」,而是「大数据时代将至」,「智能时代将至」。

 

为了迎接这个时代,我们需要规范和秩序,为大数据立法,是其中之一。

 

诚然,大数据立法面临四大挑战:分别是个人数据保护、政府数据开放、数据流通与交易、数据跨境流动。

 

但是,再困难也要去做,再大的挑战,也需要尽快立法,从制度层面保证数据的合理生产,流通,采集和使用。

 

多年以前,就有人提出一个问题:一个人在网上的资产,比如QQ账号,发的新浪微博,是否属于个人的私有财产?如果是私有财产,就应该具有继承权,可以传给后代。

 

然而,让他失望了,腾讯和新浪没有认可继承权。是不是私有财产,不得而知。

 

换到数据这个话题,用户在终端和网络上的数据是否应该属于用户个人的私有财产?是否有继承权?这也是个值得探讨的问题。

 

如果有一天,这个问题在立法上有了明确的答案,那么,数据的未来,将会是个光明的未来。

 

期待这一天早日到来。

推荐 6