Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25: java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 大数据云计算 >

大数据分析原理与实践 PDF 下载


分享到:
时间:2021-06-28 07:25来源:http://www.java1234.com 作者:转载   侵权举报
大数据分析原理与实践 PDF 下载
失效链接处理
大数据分析原理与实践  PDF 下载


本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
 
 
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/25110437.html
  
相关截图:



资料简介:
本书介绍了大数据分析的多种模型、所涉及的算法和技术、实现大数据分析系统所需的工具以及大数据分析的具体应用。本书共16章。第1章为绪论,就大数据、大数据分析等概念进行了阐释,并对本书内容进行了概述;第2~7章介绍了关联分析模型、分类分析模型、聚类分析模型、结构分析模型和文本分析模型;第8章介绍大数据分析的数据预处理问题;第9章介绍降维方法;第10章介绍了数据仓库的概念、内涵、组成、体系结构和建立方法,还介绍了分布式数据仓库系统和内存数据仓库系统。第11章介绍大数据分析算法中的回归算法、关联规则挖掘算法、分类算法以及聚类算法的实现。第12~14章介绍了三种用于实现大数据分析算法的平台,即并行计算平台、流式计算平台和大图分析平台。第15章和第16章介绍两类大数据分析的具体应用,分别讲述了社会网络分析和推荐系统。本书可作为高等院校大数据相关专业的教学用书,也可以作为从事大数据相关工作的工程技术人员的参考用书



资料目录:

前言
教学建议
第1章 绪论 1
1.1 什么是大数据 1
1.2 哪里有大数据 3
1.3 什么是大数据分析 4
1.4 大数据分析的过程、技术与难点 5
1.5 全书概览 8
小结 10
习题 10
第2章 大数据分析模型 11
2.1 大数据分析模型建立方法 11
2.2 基本统计量 13
2.2.1 全表统计量 14
2.2.2 皮尔森相关系数 15
2.3 推断统计 16
2.3.1 参数估计 16
2.3.2 假设检验 20
2.3.3 假设检验的阿里云实现 23
小结 28
习题 28
第3章 关联分析模型 30
3.1 回归分析 31
3.1.1 回归分析概述 31
3.1.2 回归模型的拓展 35
3.1.3 回归的阿里云实现 43
3.2 关联规则分析 52
3.3 相关分析 54
小结 57
习题 58
第4章 分类分析模型 60
4.1 分类分析的定义 60
4.2 判别分析的原理和方法 61
4.2.1 距离判别法 61
4.2.2 Fisher判别法 64
4.2.3 贝叶斯判别法 67
4.3 基于机器学习分类的模型 71
4.3.1 支持向量机 72
4.3.2 逻辑回归 74
4.3.3 决策树与回归树 75
4.3.4 k近邻 78
4.3.5 随机森林 78
4.3.6 朴素贝叶斯 81
4.4 分类分析实例 82
4.4.1 二分类实例 82
4.4.2 多分类实例 94
小结 101
习题 102
第5章 聚类分析模型 105
5.1 聚类分析的定义 105
5.1.1 基于距离的亲疏关系度量 105
5.1.2 基于相似系数的相似性度量 108
5.1.3 个体与类以及类间的亲疏关系度量 110
5.1.4 变量的选择与处理 111
5.2 聚类分析的分类 111
5.3 聚类有效性的评价 112
5.4 聚类分析方法概述 112
5.5 聚类分析的应用 113
5.6 聚类分析的阿里云实现 114
小结 119
习题 119
第6章 结构分析模型 122
6.1 短路径 122
6.2 链接排名 123
6.3 结构计数 125
6.4 结构聚类 126
6.5 社团发现 128
6.5.1 社团的定义 128
6.5.2 社团的分类 128
6.5.3 社团的用途 128
6.5.4 社团的数学定义 128
6.5.5 基于阿里云的社团发现 130
小结 132
习题 133
第7章 文本分析模型 135
7.1 文本分析模型概述 135
7.2 文本分析方法概述 136
7.2.1 SplitWord 136
7.2.2 词频统计 137
7.2.3 TF-IDF 138
7.2.4 PLDA 140
7.2.5 Word2Vec 147
小结 148
习题 149
第8章 大数据分析的数据预处理 150
8.1 数据抽样和过滤 150
8.1.1 数据抽样 150
8.1.2 数据过滤 154
8.1.3 基于阿里云的抽样和过滤实现 154
8.2 数据标准化与归一化 157
8.3 数据清洗 159
8.3.1 数据质量概述 159
8.3.2 缺失值填充 160
8.3.3 实体识别与真值发现 162
8.3.4 错误发现与修复 169
小结 171
习题 171
第9章 降维 173
9.1 特征工程 173
9.1.1 特征工程概述 173
9.1.2 特征变换 175
9.1.3 特征选择 178
9.1.4 特征重要性评估 183
9.2 主成分分析 191
9.2.1 什么是主成分分析 191
9.2.2 主成分分析的计算过程 192
9.2.3 基于阿里云的主成分分析 194
9.2.4 主成分的表现度量 195
9.3 因子分析 196
9.3.1 因子分析概述 196
9.3.2 因子分析的主要分析指标 196
9.3.3 因子分析的计算方法 197
9.4 压缩感知 203
9.4.1 什么是压缩感知 203
9.4.2 压缩感知的具体模型 204
9.5 面向神经网络的降维 205
9.5.1 面向神经网络的降维方法概述 205
9.5.2 如何利用神经网络降维 206
9.6 基于特征散列的维度缩减 207
9.6.1 特征散列方法概述 207
9.6.2 特征散列算法 207
9.7 基于Lasso算法的降维 208
9.7.1 Lasso方法简介 208
9.7.2 Lasso方法 209
9.7.3 Lasso算法的适用情景 211
小结 211
习题 212
第10章 面向大数据的数据仓库系统 214
10.1 数据仓库概述 214
10.1.1 数据仓库的基本概念 214
10.1.2 数据仓库的内涵 215
10.1.3 数据仓库的基本组成 215
10.1.4 数据仓库系统的体系结构 216
10.1.5 数据仓库的建立 217
10.2 分布式数据仓库系统 221
10.2.1 基于Hadoop的数据仓库系统 221
10.2.2 Shark:基于Spark的数据仓库系统 227
10.2.3 Mesa 228
10.3 内存数据仓库系统 231
10.3.1 SAP HANA 231
10.3.2 HyPer 234
10.4 阿里云数据仓库简介 236
小结 238
习题 239
第11章 大数据分析算法 240
11.1 大数据分析算法概述 240
11.2 回归算法 242
11.3 关联规则挖掘算法 248
11.4 分类算法 255
11.4.1 二分类算法 256
11.4.2 多分类算法 273
11.5 聚类算法 283
11.5.1 k-means算法 283
11.5.2 CLARANS算法 291
小结 293
习题 293
第12章 大数据计算平台 295
12.1 Spark 295
12.1.1 Spark简介 295
12.1.2 基于Spark的大数据分析实例 296
12.2 Hyracks 299
12.2.1 Hyracks简介 299
12.2.2 基于Hyracks的大数据分析实例 299
12.3 DPark

 

------分隔线----------------------------
  • 上一篇: 大数据优秀产品、服务和应用解决方案案例集 PDF 下载
  • 下一篇: AWS所有服务说明 PDF 下载
关注Java1234微信公众号
栏目列表
  • Java基础相关
  • 数据库技术相关
  • Python技术
  • 网页基础技术相关
  • JavaWeb技术相关
  • 安卓技术相关
  • 大数据云计算
  • 区块链
推荐资料
  • Kafka KSQL实战 PDF 下载

    Kafka KSQL实战 PDF 下载...

  • Flink基础讲义 PDF 下载

    Flink基础讲义 PDF 下载...

  • 大数据技术之图解Spark原理及实践

    大数据技术之图解Spark原理及实践 PDF 下载...

  • 大数据技术之Hive介绍与核心知识点

    大数据技术之Hive介绍与核心知识点 PDF 下载...

  • kafka学习 PDF 下载

    kafka学习 PDF 下载...

  • Apache Flink window-scala PDF 下载

    Apache Flink window-scala PDF 下载...

热门资料
  • 《大数据:互联网大规模数据挖掘与分布式处理
  • 《Storm技术内幕与大数据实践》PDF 下载
  • 《Spark快速大数据分析》PDF 下载
  • 《大数据Spark企业级实战》PDF 下载
  • 京东大数据平台从无到有 PDF 下载
  • 《Storm实时数据处理》PDF 下载
  • 《Storm实战:构建大数据实时计算》PDF 下载
  • Hadoop技术内幕 深入理解MapReduce架构设计与实现原
  • 《Spark大数据处理:技术、应用与性能优化》PD
  • 《大数据挑战与NoSQL数据库技术》PDF 下载

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐

深圳SEO优化公司宝鸡网站优化方案阳谷聊城网站优化清远市seo网站优化价格漯河专业网站优化公司价格滨江网站优化推荐哪里黄埔什么是网站优化搜狗排名优化网站三尾狐网站搜索优化完善火2星北仑网站优化便宜的罗定网站优化软件优化网站设计辞疵扌云速捷昆明网站排名优化工具罗湖官方网站优化怎么做上海网站快速排名优化出名的网站推广与优化什么价格凡科网站不易优化网站能优化到什么程度秦淮区网站优化推广电商新媒体网站优化提高收录大型网站有必要优化吗神马网站优化软件西安网站快速排名优化河南郑州网站搜索引擎优化了解网站的基本优化网站怎么做优化步骤织梦系统网站好优化吗网站优化时间节点山东网站优化方式宁河网站优化排名方案网站排名优化广金苹果实力亻歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化