联合写书
我要写书
联系客服
联系客服
返回顶部
我要写书
关注微信号联系客服,编写您的教材 我要写书

修改密码

Python数据分析与挖掘实战(第2版)(微课版)

翟世臣,张良均;张奥多,李婷妹,余祖伟
书号:978-7-115-69834-6
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。全书共10章,分为基础篇(第1~5章)和实战篇(第6~10章)。本书大部分章节包含了实训和课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
本书配套资源(PPT、教案、教学大纲、实训数据等)可登陆泰迪云教材账号,到资源下载处下载。
热度:
  • 简介
  • 资源下载
  • 视频
  • 上课体验
  • 反馈

图书介绍

1、本书将理论与实战相结合。本书全面贯彻党的二十大精神,以社会主义核心价值观为引领,加强基础研究、发扬斗争精神。本书以知识点为主线,将Python数据分析与挖掘的常用技术和基于项目的真实案例相结合,介绍使用Python进行数据分析与挖掘的主要方法。2、本书以应用为导向。本书讲解从知识点到算法,再到具体的案例,让读者明白如何利用所学知识来解决问题。另外,本书通过实训和课后习题帮助读者巩固所学知识,从而使读者能够真正理解并应用所学知识。3、注重启发式教学。本书围绕数据挖掘的流程展开,不堆积知识点,着重于思路启发与解决方案实施。通过对从任务需求到任务实现这一完整工作流程的体验,读者将真正理解并掌握Python数据分析与挖掘技术。

本书保留原书特色的基础上,对教材进行了内容与代码的全面升级。第2版修订的主要内容如下:1、 将Python由Python 3.8.5升级为Python 3.12.7;将Anaconda由 Anaconda3 2020.07升级为 Anaconda3 2024.10-1。 2、在每一章中新增了思维导图和素养目标。 3、第1章新增了对数据隐私安全、大语言模型和数据挖掘工具——阿里云数加的介绍。4、第3章新增了对数据漂移检验、ydata-profiling的介绍。5、第4章新增了对自动化预处理的介绍。6、第5章新增了对FP-Growth算法、SARIMA模型、深度学习相关算法的介绍。7、第6章内容由信用卡高风险客户识别更换为商超客户价值分析。8、将第10章内容更换为基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测。

图书目录

第1章    数据挖掘基础

1.1  数据挖掘发展史
1.2  数据隐私安全
       1.2.1  伦理困境与法律法规
       1.2.2  数据隐私与合规性
1.3  数据挖掘的常用方法
1.4  数据挖掘的通用流程
       1.4.1  目标分析
       1.4.2  数据抽样
       1.4.3  数据探索
       1.4.4  数据预处理
       1.4.5  分析与建模
       1.4.6  模型评价
1.5  常用数据挖掘工具
1.6  Python数据挖掘环境配置
小结
课后习题

第2章    Python数据挖掘编程基础

2.1  Python使用入门
       2.1.1  基本命令
       2.1.2  判断与循环
       2.1.3  函数
       2.1.4  库的导入与安装
2.2  Python数据挖掘建模的常用库
       2.2.1  NumPy
       2.2.2  pandas
       2.2.3  Matplotlib
       2.2.4  scikit-learn
       2.2.5  其他
2.3  深度学习框架
       2.3.1  TensorFlow
       2.3.2  Keras
       2.3.3  PyTorch
       2.3.4  PaddlePaddle
       2.3.5  Caffe
小结
实训
课后习题

第3章    数据探索

3.1  数据校验
       3.1.1  一致性校验
       3.1.2  缺失值校验
       3.1.3  异常值校验
       3.1.4  数据漂移校验
3.2  数据特征分析
       3.2.1  描述性统计分析
       3.2.2  分布分析
       3.2.3  对比分析
       3.2.4  周期性分析
       3.2.5  贡献度分析
       3.2.6  相关性分析
小结
实训
课后习题

第4章    数据预处理

4.1  数据清洗
       4.1.1  重复值处理
       4.1.2  缺失值处理
       4.1.3  异常值处理
4.2  数据变换
       4.2.1  简单函数变换
       4.2.2  数据标准化
       4.2.3  数据离散化
       4.2.4  独热编码
4.3  数据合并
       4.3.1  多表合并
       4.3.2  分组聚合
4.4  自动化预处理
       4.4.1  自动化预处理的概念
       4.4.2  常用的自动化预处理工具
       4.4.3  自动化预处理流程
       4.4.4  自动化预处理的优势与注意事项
小结
实训
课后习题

第5章    数据挖掘算法基础

5.1  分类与回归
       5.1.1  常用的分类与回归算法
       5.1.2  分类与回归模型评价
       5.1.3  线性模型
       5.1.4  决策树
       5.1.5  最近邻分类
       5.1.6  支持向量机
       5.1.7  神经网络
       5.1.8  集成算法
5.2  聚类
       5.2.1  常用的聚类算法
       5.2.2  聚类模型评价
       5.2.3  K-Means算法
       5.2.4  密度聚类
       5.2.5  层次聚类
5.3  关联规则
       5.3.1  常用关联规则算法
       5.3.2  Apriori算法
       5.3.3  FP-Growth算法
5.4  时间序列
       5.4.1  时间序列算法
       5.4.2  时间序列的预处理
       5.4.3  平稳序列分析
       5.4.4  非平稳序列分析
5.5  智能推荐
       5.5.1  常用智能推荐算法
       5.5.2  智能推荐模型评价
       5.5.3  协同过滤推荐算法
       5.5.4  基于流行度的推荐算法
5.6  深度学习
       5.6.1  深度学习的常用算法
       5.6.2  深度学习与机器学习的区别
实训
课后习题

第6章    商超客户价值分析

6.1  背景与目标
       6.1.1  背景
       6.1.2  数据说明
       6.1.3  目标
6.2  数据探索与预处理
       6.2.1  数据质量评估与预处理
       6.2.2  可视化分析
       6.2.3  相关性分析
6.3  分析与建模
       6.3.1  指标选取
       6.3.2  模型构建
6.4  结果分析
       6.4.1  客户分群
       6.4.2  客户群体对比分析
小结
实训
课后习题

第7章    餐饮企业菜品关联分析

7.1  背景与目标
       7.1.1  背景
       7.1.2  数据说明
       7.1.3  目标
7.2  数据探索
       7.2.1  分析每日用餐人数和营业额
       7.2.2  分析菜品热销度
7.3  数据预处理
       7.3.1  数据清洗
       7.3.2  属性构造
7.4  分析与建模
       7.4.1  构建Apriori模型
       7.4.2  训练模型
7.5  模型评价
小结
实训
课后习题

第8章    金融服务机构资金流量预测

8.1  背景与目标
       8.1.1  背景
       8.1.2  数据说明
       8.1.3  目标
8.2  数据探索与预处理
       8.2.1  属性构造
       8.2.2  截取平稳部分数据
       8.2.3  周期性差分
       8.2.4  平稳性检验和白噪声检验
8.3  分析与建模
       8.3.1  ARIMA模型的定阶
       8.3.2  模型检验
8.4  模型评价
小结
实训
课后习题

第9章    O2O优惠券使用预测

9.1  背景与目标
       9.1.1  背景
       9.1.2  数据说明
       9.1.3  目标
9.2  数据探索
       9.2.1  描述性统计分析
       9.2.2  分析优惠形式信息
       9.2.3  分析用户消费行为信息
       9.2.4  分析商户投放优惠券信息
9.3  数据预处理
       9.3.1  数据清洗
       9.3.2  数据变换
9.4  分析与建模
       9.4.1  决策树分类模型
       9.4.2  梯度提升分类模型
       9.4.3  XGBoost分类模型
9.5  模型评价
小结
实训
课后习题

第10章    基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测

10.1  快速构建金融服务机构资金流量预测模型
       10.1.1  数据源配置
       10.1.2  属性构造
       10.1.3  数据筛选
       10.1.4  周期性差分
       10.1.5  序列检验
10.2  分析与建模
小结
实训
课后习题

资源列表

内容筹备中,敬请期待!

视频列表

内容筹备中,敬请期待!

我们正在全力以赴不断完善本教材的上课体验,但在此期间,您可以优先体验其他教材。 感谢您的支持!
申请样书
关注公众号,填写信息,即可申请样书!