联合写书
我要写书
联系客服
联系客服
返回顶部
我要写书
关注微信号联系客服,编写您的教材 我要写书

修改密码

机器学习原理与实战

何伟,张良均;金应华,王清,施兴
书号:978-7-115-56399-6
本书以Python机器学习常用技术与真实案例相结合的方式,深入浅出介绍Python机器学习应用的重要内容。第2~6章介绍了Python机器学习中的各个步骤的具体应用,内容涵盖了数据准备、特征工程、有监督学习、无监督学习以及智能推荐等,为读者提供Python机器学习全流程的详细说明;第7~10章为4个综合案例,帮助读者巩固前6章的知识。第11章通过建模平台拖曳的图形化操作实现航空公司客户价值分析。
热度:
  • 简介
  • 资源包
  • 视频
  • 实训
  • 反馈

图书介绍

1、本书以实现机器学习流程的各个步骤为导向,深入浅出地介绍了如何从零开始构建机器学习应用所需的必备技能。2、本书所有章节均采用总分结构,先总起陈述本章涉及的内容,而后将相关知识点一一道出。设计思路以应用为导向,让读者明确如何利用所学知识来解决问题,通过课后练习巩固所学知识,使读者真正理解并能够应用所学知识。3、本书的内容由浅入深,第1章介绍机器学习相关的基本概念等知识,让读者在宏观上理解机器学习的概念和常用应用领域,同时还介绍了机器学习的通用流程和常用Python机器学习工具库。第2~6章介绍了Python机器学习中的各个步骤的具体应用,内容涵盖了数据准备、特征工程、有监督学习、无监督学习以及智能推荐等,为读者提供Python机器学习全流程的详细说明;第7~10章是前面几章的综合应用,分别介绍了市财政收入分析、基于非侵入式负荷监测与分解的电力分析、航空公司客户价值分析、广电大数据营销推荐案例,帮助读者巩固前6章的知识。第11章介绍了基于开源、去编程化的TipDM数据挖掘建模平台,通过拖曳的图形化操作实现航空公司客户价值分析。

图书目录

第1章    机器学习    1

任务1.1  认识数据分析 1
1.1    机器学习简介    1
1.1.1    机器学习的概念    1
1.1.2    机器学习的应用领域    1
1.2    机器学习通用流程    2
1.2.1    目标分析    3
1.2.2    数据准备    4
1.2.3    特征工程    6
1.2.4    模型训练与调优    6
1.2.5    性能度量    7
1.3    Python机器学习工具库简介    8
1.3.1    数据准备相关工具库    8
1.3.2    数据可视化相关工具库    9
1.3.3    模型训练与评估相关工具库    10
小结    12
课后习题    12

第2章    数据准备    14

2.1    数据质量校验    14
2.1.1    一致性校验    14
2.1.2    缺失值校验    16
2.1.3    异常值分析    18
2.2    数据分布与趋势探查    20
2.2.1    分布分析    20
2.2.2    对比分析    24
2.2.3    描述性统计分析    28
2.2.4    周期性分析    32
2.2.5    贡献度分析    33
2.2.6    相关性分析    34
2.3    数据清洗    39
2.3.1    缺失值处理    39
2.3.2    异常值处理    42
2.4    数据合并    43
2.4.1    数据堆叠    43
2.4.2    主键合并    47
小结    49
课后习题    50

第3章    特征工程    54

3.1    特征变换    54
3.1.1    简单函数变换    54
3.1.2    特征缩放    54
3.1.3    独热编码    59
3.1.4    离散化    60
3.2    特征选择    63
3.2.1    子集搜索与评价    63
3.2.2    过滤式选择    64
3.2.3    包裹式选择    65
3.2.4    嵌入式选择与L1正则化    65
3.2.5    稀疏表示与字典学习    66
小结    68
课后习题    68

第4章    有监督学习    72

4.1    有监督学习简介    72
4.2    性能度量    72
4.2.1    分类任务性能度量    72
4.2.2    预测任务性能度量    75
4.3    线性模型    76
4.3.1    线性模型简介    76
4.3.2    线性回归    76
4.3.3    逻辑回归    79
4.4    k近邻分类    83
4.5    决策树    85
4.5.1    决策树简介    86
4.5.2    ID3算法    87
4.5.3    C4.5算法    90
4.5.4    CART算法    92
4.6    支持向量机    95
4.6.1    支持向量机简介    95
4.6.2    线性支持向量机    96
4.6.3    非线性支持向量机    102
4.7    朴素贝叶斯    105
4.8    神经网络    110
4.8.1    神经网络介绍    110
4.8.2    BP神经网络    112
4.9    集成学习    117
4.9.1    Bagging    117
4.9.2    Boosting    120
4.9.3    Stacking    123
小结    124

第5章    无监督学习    125

5.1    无监督学习简介    125
5.2    降维    125
5.2.1    PCA    125
5.2.2    核化线性降维    129
5.3    聚类任务    131
5.3.1    性能度量    132
5.3.2    距离算法    134
5.3.3    原型聚类    136
5.3.4    密度聚类    146
5.3.5    层次聚类    149
小结    152
课后习题    153

第6章    智能推荐    156

6.1    智能推荐简介    156
6.1.1    什么是推荐系统    156
6.1.2    智能推荐的应用    156
6.2    智能推荐性能度量    158
6.2.1    离线实验评价指标    158
6.2.2    用户调查评价指标    161
6.2.3    在线实验评价指标    162
6.3    基于关联规则的智能推荐    163
6.3.1    关联规则和频繁项集    163
6.3.2    Apriori    164
6.3.3    FP-Growth    169
6.4    基于协同过滤的智能推荐    175
6.4.1    基于用户的协同过滤    175
6.4.2    基于物品的协同过滤    179
小结    184
课后习题    184

第7章    市财政收入分析    188

7.1    目标分析    188
7.1.1    背景    188
7.1.2    数据说明    188
7.1.3    分析目标    190
7.2    数据准备    191
7.3    特征工程    193
7.3.1    Lasso回归    193
7.3.2    特征选择    194
7.4    模型训练    195
7.4.1    灰色预测模型    195
7.4.2    关键特征预测    197
7.4.3    SVR模型预测    198
7.5    性能度量    200
小结    202
拓展思考    202
课后习题    203
操作题    203

第8章    基于非侵入式电力负荷监测与分解的电力分析    204

8.1    目标分析    204
8.1.1    背景    204
8.1.2    数据说明    205
8.1.3    分析目标    206
8.2    数据准备    207
8.2.1    数据探索    207
8.2.2    特征选择    210
8.3    模型训练及结果分析    211
小结    215
拓展与思考    215
课后习题    216

第9章    航空公司客户价值分析    217

9.1    目标分析    217
9.1.1    背景    217
9.1.2    数据说明    218
9.1.3    分析目标    219
9.2    数据准备    219
9.2.1    数据探索    220
9.2.2    数据清洗    220
9.3    特征工程    221
9.3.1    特征构建    221
9.3.2    特征选择    224
9.3.3    特征变换    224
9.4    模型训练    226
9.5    性能度量    228
9.5.1    结果分析    228
9.5.2    客户价值分析    230
小结    231
拓展思考    231
课后习题    231
操作题    231

第10章    广电大数据营销推荐    233

10.1    目标分析    233
10.1.1    背景    233
10.1.2    数据说明    234
10.1.3    分析目标    236
10.2    数据准备    237
10.2.1    数据获取    238
10.2.2    数据预处理    238
10.2.3    数据探索分析    245
10.3    特征工程    252
10.3.1    特征选择    252
10.3.2    特征构造    256
10.3.3    节目信息的获取    278
10.4    模型构建    280
10.4.1    基于物品的协同过滤算法的推荐(item-based CF)    281
10.4.2    基于Simple TagBased TF-IDF算法的标签推荐模型    284
10.4.3    Popular流行度推荐模型    288
10.5    模型评价    289
10.6    结果分析    292
小结    292
拓展与思考    293
课后习题    293

资源列表

文件名 文件大小 上传时间 操作
《机器学习原理与实战》正文数据和代码 135.69MB 2022-03-16 下载
《机器学习原理与实战》-习题数据和答案 6.46MB 2022-03-16 下载
《机器学习原理与实战》-教学进度表 25KB 2022-03-16 下载
《机器学习原理与实战》-教学大纲 34KB 2022-03-16 下载
《机器学习原理与实战》-教案 267KB 2022-03-16 下载
《机器学习原理与实战》-PPT 16.12MB 2022-03-16 下载

视频列表

内容筹备中,敬请期待!

实训列表

  • 实训1 数据质量校验V1.0.1 查看
  • 实训2 数据分布与趋势探查V1.0.0 查看
  • 实训3 数据清洗V1.0.0 查看
  • 实训4 数据合并V1.0.0 查看
申请样书
关注公众号,填写信息,即可申请样书!