- 简介
- 资源下载
- 视频
- 上课体验
- 反馈
图书介绍
1、本书内容契合“1+X”证书制度试点工作中的大数据应用开发(Python)职业技能中级证书考核标准,全书采用了以任务为导向的教学模式,深入浅出地介绍了Hadoop基本原理与架构、集群安装配置、MapReduce编程及一个完整项目案例等内容。2、在确定教学内容、明确教学重点和难点问题时,充分尊重学生认知规律和教学规律,教学内容上,以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,最后落实在任务实现环节。3、大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Hadoop大数据技术。。
图书目录
第1章 Hadoop介绍 1
1.1 Hadoop概述 1
1.2 Hadoop核心 4
1.3 Hadoop生态系统 12
1.4 Hadoop应用场景 14
小结 15
第2章 Hadoop集群的搭建及配置 16
任务2.1 安装配置虚拟机 17
任务2.2 安装Java 32
任务2.3 搭建Hadoop完全分布式集群 36
小结 50
实训 50
课后练习 51
第3章 Hadoop基础操作 53
任务3.1 查看Hadoop集群的基本信息 54
任务3.2 上传文件到HDFS目录 59
任务3.3 运行首个MapReduce任务 67
任务3.4 管理多个MapReduce任务 71
小结 76
实训 77
课后练习 78
第4章 MapReduce入门编程 80
任务4.1 使用Eclipse创建MapReduce工程 81
任务4.2 通过源码初识MapReduce编程 86
任务4.3 编程实现按日期统计访问次数 94
任务4.4 编程实现按访问次数排序 99
小结 104
实训 104
课后练习 107
第5章 MapReduce进阶编程 110
任务5.1 筛选日志文件生成序列化文件 111
任务5.2 Hadoop Java API读取序列化日志文件 115
任务5.3 优化日志文件统计程序 124
任务5.4 Eclipse提交日志文件统计程序 137
小结 144
实训 144
课后练习 146
第6章 项目案例:电影网站用户性别预测 150
任务6.1 认识KNN算法 151
任务6.2 数据预处理 153
任务6.3 实现用户性别分类 166
任务6.4 评价分类结果的准确性 178
小结 187
参考文献 188
资源列表
视频列表
内容筹备中,敬请期待!
