不是所有的寻找都有答案,真正用科学技术改变世界的人,最终会超越时间,被人铭记。

文/子雨、33   

大数据的布道者

新事物的发展总会伴着质疑与不解,也充斥着大量泡沫,但大浪淘沙,总有一批先行者探路,破愚暗以明斯道。

“我是一个固执而专一的人,无论是做学术还是步入职场,都没有脱离大数据这个行业,也是大数据坚定不移的信仰者。”数据使用协议COVA(COVALENT.AI)联合创始人RAYMOND说道。

一个懂区块链技术的工程师与一个懂数据的科学家在地球的两端,面临着同样的困扰。如何获取高质量数据?

一次回国休假,把VINCENT LI和RAYMOND GAO连到了一起。两人一拍即合,用区块链赋能大数据产业,自建公链,取名COVALENT,中文翻译共价键,意在用网络把数据连接起来。COVA联合创始人RAYMOND从本科起就与数据分析结缘,国外读博期间恰逢国内创业环境大火,于是辍学回国,这一路,无论是做学术还是步入职场,他都没有脱离大数据这个行业。

“一位60多岁的老教授因为数据行业影响到了他的科研路线,还建议我用大数据机器学习的办法做研究,我意识到大数据时代真的来了。” RAYMOND说。

不过,在从学术、投资到实际创业的过程中,数据的质量的问题一直困扰着 RAYMOND。

彼时地球的另一端,VINCENT LI有 4 年区块链研究经验,曾经利用区块链技术,内部研发了一款数字货币产品,让工程师靠做项目赢取TOKEN,然后再用TOKEN去获取理想的优质项目。

在哈佛念计算机本科期间,VINCENT就对人工智能非常感兴趣,却时常卡在数据关上。

偶然的一次回国休假,把VINCENT LI和RAYMOND GAO连到了一起。两人一拍即合,用区块链赋能大数据产业,自建公链,取名COVALENT,中文翻译共价键,意在用网络把数据连接起来。

让99%的数据浪费跑在链上

数据是死的,用数据怎样排列组合,导出结论,才是活的。

2017年,全世界产生了约22ZB的数据,2018年全球大数据市场规模将达454亿美元。

然而事实却是,百亿美元价值的大数据市场,只有不到1%得到了有效利用,99%数据白白浪费。

“中心化的古典互联网只定义了数据如何传输,却没有定义数据如何使用。” COVA联合创始人RAYMOND GAO说。

传统大数据产品在交易中,存在一个很大的问题:数据溯源和匿名性两者无法共存。

数据溯源就是追踪路径重现数据的历史状态和演变过程,实现数据历史档案的追溯。类似查看产品原材料,确保产品品质的逻辑。

在传统大数据交易中,如果企业要溯源数据,也就是查找数据信息,就必须暴露相关用户隐私。如果要保护数据来源的隐私,就无法实现溯源。

举个例子,在当下的互联网协议中,如果你是一个房地产中介,你想算出小区里有多少比例的人有第二套房,你只能要求每个人把买房信息发给他,然后算一个平均值。你一定会发现这个事情很难完成。

为什么呢?“这是我的个人隐私,提供信息给你,得不到奖励,又会泄露我的信息,谁要无偿提供给你呢?”

与互联网技术不同,区块链技术这种点对点的去中心化,能够让普通用户协同起来,形成大规模共识,把零散的劳动力、资源整合起来。所有的数据都是去中心化存储,仍然保存在本地。用户拥有全部的使用权和控制权。

而两位创始人VINCENT LI和RAYMOND GAO想做的一件事就是:用隐私保护和溯源技术调用散落在各方的优质数据,同时利用去中心化、开源的数字货币让数据进行交易,打造“数据的淘宝”。

为数据上链,打造“数据的淘宝”

数据是未来零售业的核心资产。

COVA创建了一套数据使用协议,一旦有第三方愿意付钱,可以付TOKEN来使用数据,在这个环境里用于数据计算,而且暂时不会看到原始数据,也不会把数据带走,返回的只是计算完的结果,平台不掌握任何数据的存储。

简单来说,就是利用区块链技术搜集筛选出优质的数据,并且在保障用户隐私和安全的前提下让数据像淘宝商品一样进行流通与交易。

基于COVA的公链,开发者可以在一周时间内做出一个社交网络应用。在这个社交网络上,用户的浏览记录、点赞记录等数据都是归用户所有,在用户允许且保护隐私的情况下,可以有第三方付费使用该数据。

未来还可以衍生到其他场景,只要你愿意匿名提供自己的租房信息数据,微信运动数据,美团点评数据,携程旅游数据等,不仅不用担心隐私泄露,还能“躺着”月入上千元。

“现在这部分‘数据黄金’的利润是被互联网巨头公司无条件掠夺走的。” RAYMOND提到。

人都是逐利的,上传数据就能获得TOKEN,那么会存在几个问题:

1、羊毛党为了获得更多的TOKEN上传假数据怎么办?

“我们会建立一起信用评价体系。用户上传的数据需要做一个描述,同时提供一小部分样品(SAMPLE)试用,试用完成后买家会选择是否购买完整数据。而且系统会有评价体系,该评价体系建立在区块链上,不可篡改,不存在刷好评的可能,必须是真实的购买用户才可评论。随着用户数量的增加,市场会去伪存真,使用人数最多的数据即为好数据,评价低的数据则会被市场淘汰。” RAYMOND答道。

2、未来区块链底层技术日趋完善,用户握有数据的控制权,一旦出现奖励更丰厚的数据交易平台,用户就会转移,如何保证粘性?

RAYMOND:以太坊长远看不一定有壁垒和护城河。一个项目的护城河就是看有多少人使用,为什么这些人不会转移到别的平台?这个逻辑和互联网是相通的,得流量者得天下。

假设未来有团队想开发一个DAPP,需要用到很多第三方数据,基于COVA这条供应链,他可以获取远多于其他公链的数据。

平台的优质数据越多,越能吸引开发者基于COVA公链开发应用,未来COVA在众多公链的竞争中也更具优势,优质数据的积累就是COVA的核心优势。

长远来看,数据的量越大,用户拥有的数据量越多,COVA的地位也就越高,就像互联网的马太效应,强者愈强,后来者很难超越。

目前 COVA已经完成了由FBG CAPITAL、真格基金等领投的千万美元投资。

链上数据推动人工智能

一堆数据,满纸江湖。

数据是人工智能的基石。人工智能早已脱离了“小鲜肉”的行列,步入了下半场,开始与各个行业深入结合。医疗 AI 领域专家钱院长研究发现,如果有充足的数据,人工智能很快就可以代替人类更准确地解读 CT,能够更准确地发现肿瘤病人的病灶。

人工智能走到今天,不再是算法上的瓶颈,而又回到了数据上的瓶颈。

“如果我们建立一个医疗数据交易所,让所有拥有数据的病人/医生/医院,自愿上传数据,并获得一定的报酬,数据科学家、人工智能学家,就能够更方便地进行规模化工作。” RAYMOND说道。

未来,在COVA这样一条可以高速计算,保护隐私的公链上,不仅医疗数据,金融数据、交通数据、社交网络都可以完成应用的落地化,对整个人工智能行业落地以及社会生产力的提高有巨大的推动作用。

未来区块链也不只作为数字货币的交易存在,而是真正地伴随人工智能改变人类的一切。