找回密码
 社区注册

快捷登录

QQ登录

只需一步,快速开始

快捷登录

QQ登录

只需一步,快速开始

「每日分享」什么是大数据
2022-6-18 18:59| 发布者: 张辰| 查看: 2716| 评论: 11
微富网 新闻资讯 查看内容
摘要 : 点击上方"java全栈技术"关注,每天学习一个java知识点大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。Big data is high volume, high velocity, ...

点击上方"java全栈技术"关注,每天学习一个java知识点

「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。

Big data is high volume, high velocity, and/or high variety information assets that require new forms of processing to enable enhanced decision making, insight discovery and process optimization.

「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


大数据通常都拥有海量的数据存储。仅根据2013年的统计,互联网搜索巨头百度已拥有数据量接近EB级别、阿里、腾讯声明自己存储的数据总量都达到了百PB以上。此外,电信、医疗、金融、公共安全、交通、气象等各个方面保存的数据量也都达到数十或者上百PB级别。

面对这样规模的数据存储量,依靠单台数据库服务器显然是不够的,需要以分布式文件系统(例如 HDFS)作为基石。

「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


在传统的关系型数据库中,所存储的数据都是结构化的,例如:

「每日分享」什么是大数据


但是在现实生活中,信息往往并没有严格的结构限制。比如一个电商网站需要记录如下用户行为:

用户张三, 于某某时间在商品搜索栏搜索了“苹果手机”一词,然后进入 XXX 商铺进行浏览,经过与店家沟通,讨价还价,最终以6000元的价格购买了 iPhone 7 “钢琴黑”款式手机一部。

诸如此类的用户行为数据属于非结构化数据,很难用关系型数据库存储。因此诸多No-SQL数据库(例如 HBase)成为了存储大数据的更好选择。

「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


如果没有更加快速有效的海量数据解决方案,那么如此大量多样的数据不但没有带来更多价值,反而成为了系统的负担。关于这一点,谷歌公司率先提出的MapReduce模型为我们带来了新的道路。

MapReduce可以简单的理解成一种分治方法:把庞大的任务分成若干小任务,交给多个节点进行并行处理,然后再把所有节点的处理结果合并起来,从而大大提升了数据处理效率。(关于MapReduce的详细流程,将会在以后的文章中进行讲解。)

「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


「每日分享」什么是大数据


人工智能:

「每日分享」什么是大数据


以大数据作为机器学习的训练集,从而训练出拥有一定决策能力的人工智能。典型的代表案例就是谷歌的AlphaGo, 通过大量围棋棋局的学习,最终拥有了打败围棋世界冠军的能力。

商业分析:

「每日分享」什么是大数据


从大量的用户行为数据中挖掘出有价值的商业信息。典型代表是著名社交公司LinkedIn,他们通过用户之间的关联关系,绘画出学校、公司、人才之间庞大而复杂的信息网络。不仅如此,LinkedIn还通过大量求职者和招聘方的信息,分析出哪些公司正在迅速扩张,哪些公司正在流失人才,哪些公司之间正在展开人才市场的争夺。这些对于客户公司来说,都是无价之宝。

犯罪预测:

「每日分享」什么是大数据


洛杉矶警察局曾经借助一套原本用于预测地震后余震的大数据模型,把过去80年内的130万个犯罪记录数据输入进去,结果发现其预测出的犯罪高发地点与现实惊人的吻合。后来该预测算法经过改进,已经成为了当地警局重要的参考依据,大大降低了当地的犯罪率。

「每日分享」什么是大数据


「每日分享」什么是大数据


这里所介绍的相关知识,只是作者对于大数据领域的浅层次理解。通过这篇漫画,希望没有从事过IT行业,或者不了解大数据的朋友们能够对大数据有一些初步的认知。

文章转自程序员小灰

路过

雷人

握手

鲜花

鸡蛋
发表评论

最新评论

引用 123459802 2022-6-18 19:03
转发了
引用 ubipzaewitoma 2022-6-18 19:03
转发了
引用 亡心疯i 2022-6-18 19:02
转发了
引用 在绝望中幻想菏 2022-6-18 19:02
转发了
引用 无聊上网人士人 2022-6-18 19:01
写的不错
引用 钻石糖闪糖b 2022-6-18 19:01
引用 15999457327 2022-6-18 19:00
你们没在网络邻居上共享过文件吗?
引用 太阳很大 2022-6-18 19:00
就是很大的数据啊
引用 龙武大帝君君i 2022-6-18 19:00
程序员小灰萌萌哒[灵光一闪]
引用 刘备是影帝战 2022-6-18 18:59
非常好
引用 俊浪费俊u 2022-6-18 18:59
分布式、D&C、数据挖掘、大数据,好熟啊~[可爱]

查看全部评论(11)

联系我们 搜索

联系我们

对话产生契机,讨论收获惊喜, 只为成就无限创举

湖北省 武汉市
汉阳区龙阳大道龙阳大厦A座1419

欢迎来这里一起喝喝茶,
聊聊你的产品。

+86 139 9777 1122
(9:00AM-6:00PM)

代理合作请联系本号码
业务合作请点此处

洽谈合作
admin@vfuw.cn

共享万亿级市场
工作日24小时内回复

加入我们
jiangheng@vfuw.cn

我们欢迎每一个对设计怀
有疯狂激情的人。