无障碍 关怀版
评论

本科大数据系列教材《Hadoop大数据原理与应用》

中国电子教育学会高教分会推荐·大数据系列教材

高等学校新工科应用型人才培养“十三五”规划教材

国信蓝桥教育科技(北京)股份有限公司推荐教材

本书面向Hadoop生态系统,以企业需求为导向,紧紧围绕大数据应用的闭环流程展开讲述,引导读者构建大数据知识体系和进行大数据技术的初级实践,旨在使读者掌握Hadoop生态系统的设计原理和Hadoop平台的运用能力。

本书分为上篇——Hadoop基础篇、中篇——Hadoop提高篇和下篇——案例篇三大部分,共11章,涉及数据采集、数据存储与管理、数据处理与分析、数据可视化一系列大数据应用生命周期中各阶段典型组件的理论知识、安装部署和实战使用。

向上滑动阅览

目录

第1章 大数据概述2

1.1 大数据内涵3

1.2 大数据的特征5

1.3 大数据的关键技术6

1.4 大数据产业8

1.5 大数据与物联网、云计算、人工智能、5G的关系11

1.6 大数据岗位介绍12

1.7 大数据学习路线13

本章小结14

思考与练习题15

第2章 初识Hadoop16

2.1 Hadoop概述17

2.2 Hadoop生态系统20

2.3 Hadoop的体系架构23

2.4 Hadoop的应用现状23

2.5 部署和运行Hadoop25

本章小结50

思考与练习题50

实验1 部署全分布模式Hadoop集群51

第3章 分布式文件系统HDFS52

3.1 HDFS简介53

3.2 HDFS的体系架构53

3.3 HDFS文件的存储机制55

3.4 HDFS数据的读/写过程57

3.5 实战HDFS60

3.6 HDFS的高可靠性机制75

本章小结89

思考与练习题89

实验2 实战HDFS90

第4章 分布式计算框架MapReduce91

4.1 MapReduce简介92

4.2 第一个MapReduce案例:WordCount92

4.3 MapReduce的作业执行流程97

4.4 MapReduce的数据类型与格式101

4.5 Shuffle的机制104

4.6 在MapReduce中自定义组件105

4.7 实战MapReduce109

4.8 MapReduce调优116

4.9 其他主流计算框架118

本章小结119

思考与练习题120

实验3 MapReduce编程120

第5章 统一资源管理和调度框架YARN122

5.1 初识YARN123

5.2 YARN的体系架构126

5.3 YARN的工作流程127

5.4 实战YARN129

5.5 YARN的新特性134

5.6 其他统一资源管理调度框架141

本章小结150

思考与练习题151

第6章 分布式协调框架ZooKeeper152

6.1 分布式协调技术153

6.2 初识ZooKeeper154

6.3 ZooKeeper的系统模型156

6.4 ZooKeeper的工作原理163

6.5 ZooKeeper的典型应用场景172

6.6 部署ZooKeeper集群176

6.7 实战ZooKeeper183

本章小结218

思考与练习题219

实验4 部署ZooKeeper集群和实战ZooKeeper220

第7章 分布式数据库HBase221

7.1 NoSQL简介222

7.2 初识HBase224

7.3 HBase的数据模型224

7.4 HBase的体系架构229

7.5 HBase的运行机制233

7.6 部署HBase集群235

7.7 实战HBase241

7.8 HBase的性能优化264

本章小结265

思考与练习题266

实验5 部署全分布模式HBase集群和实战HBase267

第8章 数据仓库Hive268

8.1 初识Hive269

8.2 Hive的体系架构271

8.3 Hive的数据类型273

8.4 Hive的文件格式275

8.5 Hive的数据模型275

8.6 Hive函数278

8.7 部署Hive285

8.8 实战Hive299

8.9 Hive的优化策略307

本章小结308

思考与练习题309

实验6 部署本地模式Hive和实战Hive309

中篇 Hadoop提高篇

第9章 大数据迁移和采集工具312

9.1 数据迁移工具Sqoop313

9.2 日志采集工具Flume344

9.3 分布式流平台Kafka357

9.4 ETL工具Kettle371

本章小结377

思考与练习题378

第10章 数据可视化379

10.1 可视化概念380

10.2 可视化的作用与意义381

10.3 可视化图表的类型386

10.4 可视化工具391

本章小结419

思考与练习题419

下篇 案 例 篇

第11章 华为P30手机评论画像分析422

11.1 需求分析423

11.2 项目设计423

11.3 项目环境搭建423

11.4 数据采集与预处理424

11.5 使用Hive分析数据430

11.6 数据可视化437

本章小结443

思考与练习题443

参考文献444

为了方便读者整体把握各章知识,在每章开始位置均配备有本章知识结构图。根据近几年的教学实践,建议安排32学时理论课,第1、2、5、10章每章安排2学时,第3、4、6、7、8、9章每章安排4学时,第11章由学生自学完成。另外,建议增加16学时的上机实践课。

本书面向高等院校计算机、大数据、人工智能等相关专业的研究生、本科生,可以作为专业核心课程大数据技术原理与应用的教材。本书拥有配套的实验教材《Hadoop大数据原理与应用实验教程》(亦由本书作者编写,由西安电子科技大学出版社出版),两本书配套使用,可以达到更好的学习效果。

返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读

深圳SEO优化公司坑梓关键词按天收费大运关键词排名包年推广坪山百度标王罗湖建站民治企业网站改版广州网站优化按天收费塘坑seo福永英文网站建设罗湖seo优化南联网站改版大浪优化塘坑英文网站建设西乡模板网站建设光明外贸网站制作南联百度标王福田外贸网站建设丹竹头网站推广工具坪山至尊标王沙井网页设计坑梓如何制作网站观澜网站优化推广同乐百度竞价龙岗seo网站优化永湖外贸网站设计永湖关键词排名包年推广塘坑网站推广光明百度seo观澜网站seo优化大鹏网站排名优化深圳网页制作歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化