- 简介
- 资源下载
- 视频
- 上课体验
- 反馈
图书介绍
本书全面贯彻二十大报告精神,坚持为党育人、为国育才为己任,以社会主义核心价值观为指引,尊重人才培养时代性、规律性、创造性,教材内容结合大量数据分析工程案例及教学经验,以Python数据分析常用技术和真实案例相结合的方式,深入浅出地介绍使用Python进行数据分析及应用的重要内容。全书设计思路以应用为导向,让读者明确如何利用所学知识来解决问题,通过实训和课后习题巩固所学知识,读者能够真正理解和应用所学知识,并掌握Python数据分析与应用技术。
图书目录
第1章 Python数据分析概述
1.1 认识数据分析
1.1.1 数据分析的概念
1.1.2 数据分析的流程
1.1.3 数据分析的应用场景
1.2 Python数据分析的工具
1.2.1 数据分析常用工具
1.2.2 Python数据分析的优势
1.2.3 Python数据分析常用库
1.3 安装Python的Anaconda发行版
1.3.1 Python的Anaconda发行版
1.3.2 在Windows系统中安装Anaconda发行版
1.4 Jupyter Notebook常用功能
1.4.1 Jupyter Notebook的基本功能
1.4.2 Jupyter Notebook的高级功能
小结
课后习题
第2章 NumPy数值计算基础
2.1 NumPy数组对象ndarray
2.1.1 创建数组对象
2.1.2 生成随机数
2.1.3 通过索引访问数组
2.1.4 变换数组的形状
2.2 NumPy矩阵与通用函数
2.2.1 创建NumPy矩阵
2.2.2 ufunc函数
2.3 利用NumPy进行统计分析
2.3.1 读/写文件
2.3.2 使用函数进行简单的统计分析
小结
实训
实训1 使用数组比较运算对超市牛奶价格进行对比
实训2 创建6×6的简单数独游戏矩阵
课后习题
第3章 pandas统计分析基础
3.1 读/写不同数据源的数据
3.1.1 认识pandas库
3.1.2 读/写文本文件
3.1.3 读/写Excel文件
3.1.4 读/写数据库
3.2 DataFrame的常用操作
3.2.1 查看DataFrame的常用属性
3.2.2 查、改、增、删DataFrame数据
3.2.3 描述分析DataFrame数据
3.3 转换与处理时间序列数据
3.3.1 转换时间字符串为标准时间
3.3.2 提取时间序列数据信息
3.3.3 加减时间数据
3.4 使用分组聚合进行组内计算
3.4.1 使用groupby()方法拆分数据
3.4.2 使用agg()方法聚合数据
3.4.3 使用apply()方法聚合数据
3.4.4 使用transform()方法聚合数据
小结
实训
实训1 读取并查看某地区房屋销售数据的基本信息
实训2 提取房屋售出时间信息并描述房屋价格信息
实训3 使用分组聚合方法分析房屋销售情况
课后习题
第4章 使用pandas进行数据预处理
4.1 合并数据
4.1.1 堆叠合并数据
4.1.2 主键合并数据
4.1.3 重叠合并数据
4.2 清洗数据
4.2.1 检测与处理重复值
4.2.2 检测与处理缺失值
4.2.3 检测与处理异常值
4.3 标准化数据
4.3.1 离差标准化数据
4.3.2 标准差标准化数据
4.3.3 小数定标标准化数据
4.4 变换数据
4.4.1 哑变量处理类别型数据
4.4.2 离散化连续型数据
小结
实训
实训1 合并年龄、平均血糖和中风患者信息数据
实训2 删除年龄异常的数据
实训3 离散化年龄特征
课后习题
第5章 Matplotlib、seaborn、pyecharts数据可视化基础
5.1 Matplotlib基础绘图
5.1.1 pyplot绘图基础语法与常用参数
5.1.2 使用Matplotlib绘制进阶图形
5.2 seaborn基础绘图
5.2.1 seaborn绘图基础
5.2.2 使用seaborn绘制基础图形
5.3 pyecharts基础绘图
5.3.1 pyecharts绘图基础
5.3.2 使用pyecharts绘制交互式图形
小结
实训
实训1 分析学生考试成绩特征的分布与分散情况
实训2 分析学生考试成绩与各个特征之间的关系
实训3 分析各空气质量指数之间的相关关系
实训4 绘制交互式基础图形
课后习题
第6章 使用scikit-learn构建模型
6.1 使用sklearn转换器处理数据
6.1.1 加载datasets模块中的数据集
6.1.2 将数据集划分为训练集和测试集
6.1.3 使用sklearn转换器进行数据预处理
6.2 构建并评价聚类模型
6.2.1 使用sklearn估计器构建聚类模型
6.2.2 评价聚类模型
6.3 构建并评价分类模型
6.3.1 使用sklearn估计器构建分类模型
6.3.2 评价分类模型
6.4 构建并评价回归模型
6.4.1 使用sklearn估计器构建线性回归模型
6.4.2 评价回归模型
小结
实训
实训1 使用sklearn处理竞标行为数据集
实训2 构建基于竞标行为数据集的K-Means聚类模型
实训3 构建基于竞标行为数据集的支持向量机分类模型
实训4 构建基于竞标行为数据集的回归模型
课后习题
第7章 竞赛网站用户行为分析
7.1 竞赛网站用户行为分析的背景和方法
7.1.1 分析竞赛网站背景
7.1.2 认识用户行为分析
7.1.3 竞赛网站用户行为分析的步骤与流程
7.2 预处理竞赛网站用户访问数据
7.2.1 用户识别
7.2.2 数据清洗
7.2.3 网页分类
7.2.4 构造特征
7.3 对竞赛网站用户进行分群
7.3.1 K-Means聚类算法
7.3.2 使用K-Means聚类算法进行用户分群
7.3.3 模型应用
小结
实训
实训1 处理某App用户信息数据集
实训2 构建与用户使用信息相关的特征
实训3 构建K-Means聚类模型
课后习题
第8章 企业所得税预测分析
8.1 企业所得税预测的背景与方法
8.1.1 分析企业所得税预测背景
8.1.2 企业所得税预测的方法
8.1.3 企业所得税预测的步骤与流程
8.2 分析企业所得税数据特征的相关性
8.2.1 相关性分析
8.2.2 计算Pearson相关系数
8.3 使用Lasso回归选取企业所得税预测的关键特征
8.3.1 Lasso回归方法
8.3.2 选取关键特征
8.4 使用灰色预测算法和SVR算法构建企业所得税预测模型
8.4.1 灰色预测算法
8.4.2 SVR算法
8.4.3 预测企业所得税
小结
实训
实训1 处理二手汽车交易数据集
实训2 构建二手汽车价格预测关键特征
实训3 构建线性回归模型
课后习题
第9章 餐饮企业客户流失预测
9.1 餐饮企业客户分析需求
9.1.1 分析餐饮企业客户流失预测背景
9.1.2 认识餐饮企业客户流失预测
9.1.3 餐饮企业客户流失预测的步骤与流程
9.2 预处理餐饮企业数据
9.2.1 数据探索
9.2.2 查看重复值
9.2.3 处理异常值
9.2.4 处理缺失值
9.2.5 构建客户流失特征
9.3 使用决策树算法和支持向量机算法进行餐饮企业客户流失预测
9.3.1 决策树算法
9.3.2 支持向量机算法
9.3.3 预测餐饮企业客户流失
小结
实训
实训1 预处理尺码信息数据
实训2 构建支持向量机分类模型预测客户服装尺寸
课后习题
第10章 基于TipDM数据挖掘建模平台实现客户流失预测
10.1 平台简介1
10.1.1 共享库1
10.1.2 数据连接1
10.1.3 数据集1
10.1.4 我的工程1
10.1.5 个人组件10.2 使用平台实现客户流失预测1
10.2.1 使用平台配置客户流失预测案例的步骤和流程1
10.2.2 数据源配置1
10.2.3 数据预处理1
10.2.4 构建模型
小结
实训
实训 预测客户服装尺寸
课后习题
资源列表
内容筹备中,敬请期待!
视频列表
内容筹备中,敬请期待!