25 个令人大开眼界的大数据现象及有趣事实
随著巨量资料时代来临,大数据一词已经十分普及,甚至有些被滥用的趋势。在这个时代,切身体会到「大数据」货真价实的存在、以及解读大数据的潜力成为我们的重要课题。
在此整理了 25 个所谓的「大数据现象」(Big Data phenomenon)及「大数据事实」(Big Data fun facts)并附上资料来源供大家参考,看完你将会对大数据有多「大」有更清楚的认知,而且也对大数据的潜力及它带来的改变有更深一层的解读。
- 我们现在每两天产生的资料量是相当于过去到 2003 年为止累积的资料量。[Source]
- 根据 IDC,现今世界上 90% 的资料量是在过去两年多裡所产生的。[Source]
- 根据 UCSD 的研究调查,2008 年光美国居民就生产了 3.6 ZB 的资料量。[Source]
- 2016 年的网路流量将会到达 1.3 ZB(Zettabyte = 10^21 bytes)。[Source]
- 根据 IDC 跟 EMC 的研究分析,估计了 2020 年时,数位资料量将会从 3.2 ZB 成长到 40 ZB。[Source]
- 企业所获取且储存的资料量每 1.2 年就双倍成长。[Source]
- 每分钟世界上有近 2 亿封 E-mail 被寄出,也就是每天 2470 亿封 E-mail,不过其中 80% 是垃圾信件。[Source]
- 每分钟 Youtube 影片被上传超过 100 个小时,而且每天上传的影片量要花你 15 年的时间来看完。[Source]
- 如果我们将一天内产生的资料全部烧录进 DVD 光碟内,那这些光碟叠起来可以搭成地表到月球的 DVD 高塔,而且还是「双塔」。[Source]
- 每天每分钟有约 570 个新网站出现。[Source]
- 大数据飞快成长,到 2015 年,为了处理大数据,全球多出了 4.4 百万个 IT 职位,也因此这方面的专业人士缺口,各行各业都在抢夺大数据专家 >> 还没决定未来方向的学子们不妨考虑这个领域。[Source]
- 根据 McKinsey Global Institute 的资料,到 2018 年时,美国地区将面临 14 万到 19 万的大数据专业人才短缺,以及 1 百 50 万个拥有洞察大数据的能力、因而做出好的企业决策管理阶层人才。[Source]
- 目前世界各地的数据中心(超过 50 万个)加起来相当于 6000 个足球场的大小。[Source]
- 从 2012 年到 2014 年,行动装置上传输的资料量成长了 81%,达到 1.5 Exabytes (Exabytes = 10^18 bytes),其中 53% 来自影音资料。[Source]
- NSA 每天得分析 1.6 % 的全球网路资料量 —— 约 30 PB (Petabytes = 10^15 bytes)。[Source]
- Hadoop 被公认为大数据主流技术(请参考文章:认识大数据的黄色小象帮手 –– Hadoop),根据市场研究机构 Allied Market Research,Hadoop 市场价值从 2013 年 20 亿,估计到了 2020 年时会飙涨到 500 亿。[Source]
- 根据 IDC 的分析,2008 年时数位资料量就超过了目前已知的宇宙内星星数量,而且以资料成长的速度,2023 年时全球资料量将会超过亚佛加厥常数(Avogadro’s number)—— 也就是 6.022 × 10^23。[Source]
- 由于物联网的蓬勃发展,智慧型装置的数量将会从现在到 2020 年将从 130 亿成长到 500 亿。[Source]
- 在加州及一些其他地区,大数据已经被用来建立模式、预测犯罪,而且比现今的其他预测技术来得准确。(有兴趣请参考相关文章:英美城市用大数据,揪出未知的细菌、罪犯与恶棍交易员)[Source]
- 根据 Tata Consultancy Services Limited(TCS)在 2013 年发表的研究,各企业的资料裡 51% 是结构化资料、27% 是非结构化资料、21% 是半结构化资料。[Source]
- 有将近 75% 的企业表示将逐渐增加对大数据的投资。[Source]
- 根据 CIO 的报告,38% 的机构根本不知道大数据是什麽,27% 的机构对大数据则是一知半解。[Source:]
- 根据 EMC2 的报告,25% 的企业已经有聘请资料科学家,24% 的企业正在使用大数据分析工具,57% 的企业则在慎重考虑采用大数据分析工具。 [Source]
- 如果大数据能善加利用在医疗领域,以美国地区为例,将会减少 8% 的医疗开销并省下 3000 亿美元。[Source]
- 最近几年来,已经有 5 亿美元的风险投资基金注入大数据科技公司裡。[Source]
本文文字及图片出自 www.inside.com.tw
你也许感兴趣的:
- 【外评】电脑从哪里获取时间?
- 【外评】为什么 Stack Overflow 正在消失?
- Android 全力押注 Rust,Linux 却在原地踏步?谷歌:用 Rust 重写固件太简单了!
- 【外评】哪些开源项目被广泛使用,但仅由少数人维护?
- 【外评】好的重构与不好的重构
- C 语言老将从中作梗,Rust for Linux 项目内讧升级!核心维护者愤然离职:不受尊重、热情被消耗光
- 【外评】代码审查反模式
- 我受够了维护 AI 生成的代码
- 【外评】Linux 桌面市场份额升至 4.45
- 【外评】作为全栈开发人员如何跟上 AI/ML 的发展?
6.022 × 10^23是阿伏加德罗常数,高中化学学过,就是一摩尔纯净物的原子或分子书