金融数据的含金量
谈数据必须先谈数据的完整度和价值含量。就像煤矿一样,大数据中的价值含量、挖掘成本比数量更为重要。非结构化数据,就像是有杂质的煤矿,无法直接使用。大数据还需要进行脱敏、提纯、结构化,才能变成可以被直接运用于商业层面的有价值的信息。
金融数据作为专业度要求更高的数据尤为如此。对于BAT三家而言,布局其实都比较完整。2015年年底的时候,阿里集团透露,在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据。
BAT三家公司,数据体积相差不会太多, 三家几乎都有LBS、交易、社交等一系列不同维度数据,只是能力有所区别。
三家数据核心优势可以如此简单划分——
百度:基于搜索而诞生的公共数据、需求数据。百度的优势在于数据最全面,数据样本比较复杂,数据的广度和多样性上比较强,拥有核心技术和数据矿山,而且是一座富矿;
阿里:基于淘宝天猫业务而诞生的电商数据、信用数据。阿里的核心业务在电子商务上,数据比较聚集,更容易做分析。这种数据类型的优势在于,更容易变现,挖掘出商业价值;
腾讯:基于微信、QQ诞生的社交数据、关系数据,以及游戏数据,相对较杂。不过,容易分析人们的生活和行为,从里面挖掘出商业、健康等领域的信息;