隐私vs.大数据分析之浅析

时间:2017-12-06 13:04

加拿大皇家银行资深风险投资顾问陈思进

加拿大皇家银行资深风险投资顾问陈思进

不久前,“华为”和“腾讯”为了分享微信数据,引发了一场互不相让的争执,从这场争论的本质而言,是关于标准、流量、大数据所产生的利益纠纷。这种纠纷如果处理不当,对普通消费者来说,有着隐私权被侵犯的风险。

首先,何谓大数据呢?

大数据,是收集大型和复杂数据,以及有关数据分析的术语,记录着任何可识别的个人信息,例如姓名、地址、消费取向、以及病史。这些数据量阻碍了传统分析方法的有效性。大数据不是专注个别数据之间的精确关系,而是使用各种算法和技术,来推断整个数据的总趋势,注重的是数量而不是质量,是寻找“什么”的相关性,而非“为什么”的因果关系。

比如,通过收集来的大数据进行分析,可以为政府(或企业)的建设计划,提供巨大的前景和机会,产生更有效和更快速的见解。但也可能存在严重的隐私挑战、不准确的预测结果、抱有偏见的数据,以及未经授权使用个人信息。

据《华尔街日报》(中文版)的报道,“华为”正在通过其荣耀Magic智能手机收集用户活动信息,以打造其人工智能功能(使手机能够基于用户的短信内容推荐餐厅)。为此,“腾讯”已要求中国政府介入此事。

其实,政府机构有必要制定保障措施,以确保个人信息得到适当的收集、使用、保留和披露。举美国为例。奥巴马总统根据“爱国者法案”第215条,关于美国国家安全局进行大数据收集计划改革的演讲之后,总统顾问约翰·派德斯塔(Richard Podesta)宣布:

“一项全面检讨大数据将如何影响我们的生活和工作方式、政府和公民之间的关系、以及公共和私营部门如何刺激创新,最大限度地让这些信息自由流动,但同时尽量减少隐私风险”,旨在允许政府收集民众的电话数据。

自2012年发布“消费者权益隐私权法案”以来,这是白宫宣布的第一个主要有关隐私的举措。联邦政府的主要官员,包括总统科学顾问和总统科学技术顾问委员会等,也都许下了这样的承诺。

说实在的,这个问题在大数据之前就存在,直到大数据分析提供了准确的工具和技术,即DIKW(Data数据,Information信息,Knowledge知识,Wisdom智慧)金字塔。而大数据分析的最复杂的从业者,一直走在金字塔的智慧之上。

随着时间的推移,数据收集在过去十年中,呈现爆炸式的增长,从医药、金融机构、社交网络等多个领域。这些“知识”被跟踪,并被策划成一个非常个人化的个人资料,使大多数人感到非常不舒服(知道某人或某事对他们了解甚多),个人隐私可能完全暴露无遗。

任何高新科技都可能是把双刃剑。谈到这儿,我不禁想起了号称“人类历史上最好看的小说”《基地》系列里的心理史学(Psycohistory),它准确预测了社会的发展,对于个人而言,是势不可挡的。这是科普科幻大师阿西莫夫从统计物理学得来的灵感:

任意一个气体分子都是随机运动的,但是将千千万万个气体分子结合起来的气体,却显示出极为确定的特性。那么人类呢?个体的反应不能够预测,而群体的反应却可以用数学工具来预测。这不就是当下的热词儿——“大数据”分析吗?

而经济学其实就是试图预测大范围内的人类群体的反应和动作,大数据给了他们这样的工具。而至于个人隐私,对个体而言,就很可能只能被牺牲了……

文:陈思进

更多精彩内容欢迎搜索关注微信公众号:原子智库(AtomThinkTank)