大数据与Hadoop入门指引
文档内容节选
知数堂数据系列公开课 大数据与Hadoop入门指引 20171123 关于我 王晓伟412wxw163com 大连海事大学 计算机学院 本科 清华大学 软件学院 软件工程硕士MSE 六年大数据相关工作经验 主要经历 畅游 系统工程师 搜狗 Hadoop工程师 猎聘网 DIG部数据平台负责人 内容提要 什么是大数据 研究大数据的技术数据科学 如何处理大数据Hadoop系统 怎样学习Hadoop 数据概念 Big data又称为巨量资料,指的是传统数据处理 应用软件不足以处理它们的大或复杂的数据集的术语 大数据的四大特征: Volume数据量大,通常为TB至Pb级 Variety:类型繁多,包含结构化和非结构化数据 Value:价值密度低 Velocity:速度快时效高 数据法论:相关关系非因果关系 通过大数据,可直接发现相关关系,而 无需印证因果关系,这为处理问题和分析问 题提供了一种新的思路: 橙汁阿司匹林的组合可以抑制癌症 Kaggle:橙色的车故障率最低 挖掘机指数:通过挖掘机数据预测宏观经 济 ......
猜您喜欢
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
评论