大数据

"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。大数据让我们以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见,最终形成变革之力。

SEATTLE website template

大数据特点

可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。

数据体量巨大。从TB级别,跃升到PB级别。

数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。

价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。

处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。

大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。大数据不是要教机器像人一样思考,相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。大数据的科学价值和社会价值体现在:一方面,对大数据的掌握程度可以转化为经济价值的来源,另一方面,大数据时代已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。