第1章 大数据概论
1.1 数据的基本概念
1.1.1 什么是数据
1.1.2 数据组成结构
1.1.3 数据的价值
1.2 什么是大数据
1.2.1 大数据产生背景
1.2.2 大数据发展的原动力
1.2.3 大数据基本概念与特征
1.2.4 大数据与云计算
1.2.5 大数据与人工智能
1.3 大数据主要技术
1.3.1 概述
1.3.2 大数据采集与处理
1.3.3 大数据存储技术
1.3.4 大数据计算技术
1.3.5 大数据可视化
1.3.6 大数据安全
1.4 大数据主流框架
1.4.1 HadoOp
1.4.2 ZooKeeper
1.4.3 HBaSe
1.4.4 Hive
1.4.5 StOrm
1.4.6 F1Ume
1.4.7 Kafka
1.5 本章小结
1.6 习题
第2章 大数据基础知识
2.1 概述
2.1.1 Hadoop产生背景
2.1.2 Hadoop核心模块
2.1.3 Hadoop相关项目
2.2 Common
2.3 HDFS
2.3.1 HDFS设计思想
2.3.2 HDFS体系结构
2.3.3 文件系统命名空间
2.3.4 数据复制
2.3.5 副本放置策略
2.3.6 副本选择
2.3.7 安全模式
2.3.8 元数据的持久性
2.3.9 通信协议
2.3.10 健壮性
2.4 YARN
2.5 MapReduce
2.6 Hadoop应用场景
2.7 Hadoop环境配置
2.7.1 HadoOp配置基础知识
2.7.2 HadOOp安装模式
2.7.3 Had∞p版本选择
2.7.4 Hadoop伪分布模式搭建
2.8 基于Hadoop平台的IDEA开发环境搭建
2.8.1 Maven项目的创建
2.8.2 编写经典的MapReduce
程序WordCount
2.9 本章小结
2.10 习题
第3章 大数据文件存储系统
3.1 数据块
3.2 HDFS工作流
3.2.1 HDFS写数据过程
3.2.2 HDFS读数据过程
3.3 HDFS应用程序设计
3.3.1 HDFS Shell命令
3.3.2 Web接口
3.3.3 HDFS API
3.3.4 HDFS API写操作
3.3.5 HDFS API读操作
3.4 HDFS存储格式
3.5 Had00p I/O
3.5.1 压缩
3.5.2 110序列化类型
3.6 本章小结
3.7 习题
第4章 大数据计算技术
4.1 MapReduce运行过程
4.2 MapReduce编程过程
4.3 MapReduce数据类型
4.4 Mapper输入
4.5 Shuffle原理
4.5.1 Shuffle工作原理
4.5.2 自定义分区
……
第5章 大数据应用程序协调服务
第6章 大数据存储应用技术
第7章 大数据仓库应用技术
第8章 大数据实时应用技术
展开