- 简介
- 资源下载
- 视频
- 上课体验
- 反馈
图书介绍
1、本书是“十四五”职业教育国家规划教材,也是校企合作共同开发的大数据技术精品系列教材,是岗课赛证融通新形态特色教材。教材面向大数据技术专业“数据分析与开发”岗位核心课程,充分融入全国职业院校大数据技术与应用赛项、泰迪杯数据分析技能赛的技术标准要求,属于大数据应用开发(Python)“1+X”职业技能中级证书的配套图书,同时可作为高校大数据技术相关专业教材。本书 2018 年首次出版、2021年、2024年进行升级改版,受到广大师生的欢迎,累计发行量突破 17 万册。2、本书采取基于任务导向的理论实践一体化编写模式。注重学生的实践能力培养,以解决实际问题为学习目标,以实战案例贯穿为学习手段。全面地介绍数据分析的流程和 Pyhton 数据分析库的应用,详细讲解了利用 Pyhton 解决企业实际问题的方法。3、本书匹配了丰富实用的教学资源。教材配套了 32 个微课教学视频、18 个PPT 与教案、文档及源代码等资源,同时各章都包含实训与课后习题,方便教师教学和帮助读者巩固所学知识技能和进行自学。
本书保留原书特色的基础上,对教材进行了内容与代码的全面升级。第3版修订的主要内容如下:1、教材体裁由章节任务式结构,调整为项目任务式结构。2、将Python由Python 3.8.5升级为Python 3.11.7;将Anaconda由Anaconda3 2020.11升级为Anaconda3 2024.02-1。3、全书中补充了素养目标。4、项目5中删除了分类散点图、线性回归拟合图的绘制方法介绍。5、新增了一章内容:“项目6 线上网站书籍数据可视化分析”。6、将第2版的第6章顺序调整为了项目7。7、删除了第2版中的“第7章 竞赛网站用户行为分析”“第8章 企业所得税预测分析”。8、将第2版的第9章顺序调整为了项目8,并增加了案例的难度,添加了聚类分析的内容。9、项目3、5中更换了部分知识准备的示例及其数据。10、项目2、3、4、5、7新增了贯穿性项目,实现以项目为导向。11、项目2、3、4、5、7的课后习题中新增了贯穿性的实践题。
图书目录
项目1 Python数据分析概述
任务1.1 认识数据分析
【知识准备】
1.1.1 掌握数据分析的概念
1.1.2 掌握数据分析的流程
1.1.3 了解数据分析的应用场景
任务1.2 熟悉Python数据分析的工具
【知识准备】
1.2.1 了解数据分析常用工具
1.2.2 了解Python数据分析的优势
1.2.3 了解Python数据分析常用库
任务1.3 安装Python的Anaconda发行版
【任务描述】
【任务分析】
【知识准备】
了解Python的Anaconda发行版
【任务实现】
任务1.4 掌握Jupyter Notebook常用功能
【知识准备】
1.4.1 掌握Jupyter Notebook的基本功能
1.4.2 掌握Jupyter Notebook的高级功能
项目小结
课后习题
项目2 粮食产量分析——NumPy数组计算基础
任务2.1 创建粮食产量数据
【任务描述】
【任务分析】
【知识准备】
2.1.1 创建数组对象
2.1.2 生成随机数
2.1.3 通过索引访问数组
2.1.4 变换数组的形状
【任务实现】
任务2.2 分析粮食产量增长情况
【任务描述】
【任务分析】
【知识准备】
2.2.1 创建NumPy矩阵
2.2.2 ufunc函数
【任务实现】
任务2.3 对粮食产量进行统计分析
【任务描述】
【任务分析】
【知识准备】
2.3.1 读/写文件
2.3.2 使用函数进行简单的统计分析
【任务实现】
项目小结
项目实训
实训1 使用数组比较运算对超市牛奶价格进行对比
实训2 创建6×6的简单数独游戏矩阵
课后习题
项目3 工业产品产量统计分析——pandas统计分析基础
任务3.1 读取工业产品产量数据
【任务描述】
【任务分析】
【知识准备】
3.1.1 认识pandas库
3.1.2 读/写文本文件
3.1.3 读/写Excel文件
3.1.4 读/写数据库
【任务实现】
任务3.2 分析工业产品产量数据的基本情况
【任务描述】
【任务分析】
【知识准备】
3.2.1 查看DataFrame的常用属性
3.2.2 查、改、增、删DataFrame数据
3.2.3 描述分析DataFrame数据
【任务实现】
任务3.3 分析一定时间周期内工业产品产量变化情况
【任务描述】
【任务分析】
【知识准备】
3.3.1 转换时间字符串为标准时间
3.3.2 提取时间序列数据信息
3.3.3 加减时间数据
【任务实现】
任务3.4 工业产品产量数据统计分析
【任务描述】
【任务分析】
【知识准备】
3.4.1 使用groupby()方法拆分数据
3.4.2 使用agg()方法聚合数据
3.4.3 使用apply()方法聚合数据
3.4.4 使用transform()方法聚合数据
【任务实现】
项目小结
项目实训
实训1 读取并查看某地区房屋销售数据的基本信息
实训2 提取房屋售出时间信息并描述房屋价格信息
实训3 使用分组聚合方法分析房屋销售情况
课后习题
项目4 电商产品销售数据预处理——使用pandas进行数据预处理
任务4.1 合并订单信息数据和商品信息数据
【任务描述】
【任务分析】
【知识准备】
4.1.1 堆叠合并数据
4.1.2 主键合并数据
4.1.3 重叠合并数据
【任务实现】
任务4.2 清洗电商产品销售数据
【任务描述】
【任务分析】
【知识准备】
4.2.1 检测与处理重复值
4.2.2 检测与处理缺失值
4.2.3 检测与处理异常值
【任务实现】
任务4.3 标准化电商产品销售数据
【任务描述】
【任务分析】
【知识准备】
4.3.1 离差标准化数据
4.3.2 标准差标准化数据
4.3.3 小数定标标准化数据
【任务实现】
任务4.4 变换电商产品销售数据
【任务描述】
【任务分析】
【知识准备】
4.4.1 哑变量处理类别型数据
4.4.2 离散化连续型数据
【任务实现】
项目小结
项目实训
实训1 合并年龄、平均血糖和中风患者信息数据
实训2 删除年龄异常的数据
实训3 离散化年龄特征
课后习题
项目5 电商销售可视化分析——Matplotlib、seaborn、pyecharts数据可视化基础
任务5.1 用户性别年龄构成及订单数量变化分析
【任务描述】
【任务分析】
【知识准备】
5.1.1 熟悉pyplot绘图基础语法与常用参数
5.1.2 使用Matplotlib绘制进阶图形
【任务实现】
任务5.2 用户年龄特征与电商行为分析
【任务描述】
【任务分析】
【知识准备】
5.2.1 熟悉seaborn绘图基础
5.2.2 使用seaborn绘制基础图形
【任务实现】
任务5.3 年龄段、用户地区和商品偏好分析
【任务描述】
【任务分析】
【知识准备】
5.3.1 熟悉pyecharts绘图基础
5.3.2 使用pyecharts绘制交互式图形
【任务实现】
项目小结
项目实训
实训1 分析学生考试成绩特征的分布与分散情况
实训2 分析学生考试成绩与各个特征之间的关系
实训3 分析各空气质量指数之间的相关关系
实训4 绘制交互式基础图形
课后习题
项目6 线上书籍网站数据可视化分析
任务6.1 了解线上书籍网站数据可视化分析的背景和方法
【知识准备】
6.1.1 了解线上书籍网站数据可视化分析的背景
6.1.2 认识可视化分析
6.1.3 线上网站书籍数据可视化分析的步骤与流程
任务6.2 线上网站书籍数据预处理
【任务描述】
【任务分析】
【任务实现】
6.2.1 检测与处理缺失值
6.2.2 检测重复值
6.2.3 变换数据的格式
任务6.3 线上网站书籍数据可视化分析
【任务描述】
【任务分析】
【任务实现】
6.3.1 分析Top5出版社图书数量分布情况
6.3.2 分析图书价格区间分布情况
6.3.3 分析各评论类型的数量关系
6.3.4 分析2014年-2023年书籍数量和书籍评分分布情况
项目小结
项目实训 超市销售数据可视化分析
课后习题
项目7 线上书籍网站数据综合分析——使用scikit-learn构建模型
任务7.1 使用sklearn转换器处理线上书籍网站数据
【任务描述】
【任务分析】
【知识准备】
7.1.1 加载datasets模块中的数据集
7.1.2 将数据集划分为训练集和测试集
7.1.3 使用sklearn转换器进行数据预处理
【任务实现】
任务7.2 构建基于线上书籍网站数据的聚类模型
【任务描述】
【任务分析】
【知识准备】
7.2.1 使用sklearn估计器构建聚类模型
7.2.2 评价聚类模型
【任务实现】
任务7.3 构建基于线上书籍网站数据的分类模型
【任务描述】
【任务分析】
【知识准备】
7.3.1 使用sklearn估计器构建分类模型
7.3.2 评价分类模型
【任务实现】
任务7.4 构建基于线上书籍网站数据的回归模型
【任务描述】
【任务分析】
【知识准备】
7.4.1 使用sklearn估计器构建线性回归模型
7.4.2 评价回归模型
【任务实现】
项目小结
项目实训
实训1 使用sklearn处理竞标行为数据集
实训2 构建基于竞标行为数据集的K-Means聚类模型
实训3 构建基于竞标行为数据集的支持向量机分类模型
实训4 构建基于竞标行为数据集的回归模型
课后习题
项目8 餐饮企业综合分析
任务8.1 了解餐饮企业综合分析的背景和方法
【知识准备】
8.1.1 了解餐饮企业综合分析的背景
8.1.2 认识餐饮企业综合分析
8.1.3 餐饮企业综合分析的步骤与流程
任务8.2 预处理餐饮企业数据
【任务描述】
【任务分析】
【任务实现】
任务8.3 使用K-Means聚类算法进行餐饮企业客户分群
【任务描述】
【任务分析】
【知识准备】
了解K-Means聚类算法
【任务实现】
任务8.4 使用决策树算法和支持向量机算法进行餐饮企业客户流失预测
【任务描述】
【任务分析】
【知识准备】
8.4.1 了解决策树算法
8.4.2 了解支持向量机算法
【任务实现】
项目小结
项目实训
实训1 构建支持向量机分类模型预测客户服装尺寸
实训2 构建K-Means聚类模型进行某App用户分群
实训3 构建线性回归模型预测二手汽车价格
课后习题
项目9 基于TipDM大数据挖掘建模平台实现客户流失预测
任务9.1 TipDM大数据挖掘建模平台简介
【知识准备】
9.1.1 共享库
9.1.2 数据连接
9.1.3 数据集
9.1.4 我的工程
9.1.5 个人组件
任务9.2 使用平台实现客户流失预测
【任务描述】
【任务分析】
【任务实现】
9.2.1 使用平台配置客户流失预测案例的步骤和流程
9.2.2 数据源配置
9.2.3 数据预处理
9.2.4 构建模型
项目小结
项目实训 预测客户服装尺寸
课后习题
关于资源
本书匹配了丰富实用的教学资源。教材配套了1个教学大纲、1个教学进度表、10个教案、39个微课教学视频、20个PPT、多个源代码和实验数据等,同时各章都包含实训与课后习题,方便教师教学和帮助读者巩固所学知识技能和进行自学。
资源列表
内容筹备中,敬请期待!
视频列表
内容筹备中,敬请期待!