- 简介
- 资源下载
- 视频
- 上课体验
- 反馈
图书介绍
本书特色:本书全面贯彻党的二十大精神,以社会主义核心价值观为引领,加强基础研究、发扬斗争精神,为建设社会主义文化强国、数字强国添砖加瓦。全书将理论与实战结合,注重实战思路的融会贯通。本书采用图文并茂的方式和简洁易懂的语言,旨在引导读者从实际应用出发,循序渐进地掌握自然语言处理。从每个知识点的背景故事开始,逐步深入到原理的剖析,再通过新闻类型分类、社交媒体分析、旅游评论分析以及文本生成等案例,直观展示如何将所学技能转化为解决实际问题的利器。全书内容紧贴实用需求,避免冗余理论堆砌,专注于启发思维和提供切实可行的解决方案,让读者能够轻松上手,真正将NLP技术应用于日常生活和工作之中。
图书目录
第1章 导论
1.1 自然语言处理概述
1.1.1 发展过程及未来展望
1.1.2 研究内容与常见应用
1.1.3 自然语言处理的基本流程
1.2 自然语言处理的开发环境
1.2.1 Python的优势
1.2.2 自然语言处理开发环境配置
1.3 自然语言与大语言模型
本章小结
课后习题
第2章 文本基础处理
2.1 文本数据源
2.2 语料库
2.2.1 语料库的类型
2.2.2 语料库的用途
2.2.3 语料库的构建与获取
2.3 中文分词
2.3.1 常见中文分词方法
2.3.2 基于jieba库的中文分词
2.4 词性标注与命名实体识别
2.4.1 词性标注简介与规范
2.4.2 命名实体识别简介与常用算法
2.4.3 基于jieba库的词性标注与命名实体识别
2.5 关键词提取
2.5.1 常见关键词提取算法
2.5.2 提取文本关键词
本章小结
课后习题
第3章 文本预处理与分析
3.1 文本向量化与相似度
3.1.1 文本向量化与相似度简介
3.1.2 常见文本向量化方法
3.1.3 文本向量化实现
3.1.4 常用文本相似度算法
3.1.5 文本相似度算法实现
3.2 文本分析简介
3.2.1 结构化分析
3.2.2 语义化分析
3.3 文本分析常用算法
3.3.1 常用机器学习算法
3.3.2 常用深度学习算法
本章小结
课后习题
第4章 新闻自动分类
4.1 业务背景与项目目标
4.1.1 业务背景
4.1.2 数据说明
4.1.3 分析目标
4.2 分析方法与过程
4.2.1 数据采集
4.2.2 数据探索
4.2.3 文本预处理
4.2.4 构建SVM模型
4.2.5 模型评估
本章小结
课后习题
第5章 “天问一号”事件用户评论情感分析
5.1 业务背景与项目目标
5.1.1 业务背景
5.1.2 数据说明
5.1.3 分析目标
5.2 分析方法与过程
5.2.1 数据探索
5.2.2 文本预处理
5.2.3 绘制词云图
5.2.4 模型构建与训练
5.2.5 模型评估
5.2.6 模型优化
本章小结
课后习题
第6章 游客景区印象分析
6.1 业务背景与项目目标
6.1.1 业务背景
6.1.2 数据说明
6.1.3 分析目标
6.2 分析方法与流程
6.2.1 文本预处理
6.2.2 景区印象分析
6.2.3 景区特色分析
6.2.4 提升景区美誉度的建议
本章小结
课后习题
第7章 论文标题自动生成
7.1 业务背景与项目目标
7.1.1 业务背景
7.1.2 数据说明
7.1.3 分析目标
7.2 分析方法与流程
7.2.1 文本预处理
7.2.2 训练模型
7.2.3 结果与分析
本章小结
课后习题
第8章 基于TipDM大数据挖掘建模平台的游客景区印象分析
8.1 TipDM大数据挖掘建模平台简介
8.1.1 共享库
8.1.2 数据连接
8.1.3 数据集
8.1.4 我的工程
8.1.5 个人组件
8.2 使用平台实现游客景区印象分析
8.2.1 使用平台实现游客景区印象分析的总体流程
8.2.2 配置数据源
8.2.3 文本预处理
8.2.4 景区印象分析
8.2.5 景区特色分析
本章小结
课后习题
资源列表
视频列表
内容筹备中,敬请期待!










老师交流Q群
关注 "官方公众号"