- 简介
- 资源下载
- 视频
- 上课体验
- 反馈
图书介绍
本书特色:本书全面贯彻党的二十大精神,以社会主义核心价值观为引领,加强基础研究、发扬斗争精神,为建设社会主义文化强国、数字强国添砖加瓦。全书将理论与实战结合,注重实战思路的融会贯通。本书采用图文并茂的方式和简洁易懂的语言,旨在引导读者从实际应用出发,循序渐进地掌握自然语言处理。从每个知识点的背景故事开始,逐步深入到原理的剖析,再通过新闻类型分类、社交媒体分析、旅游评论分析以及文本生成等案例,直观展示如何将所学技能转化为解决实际问题的利器。全书内容紧贴实用需求,避免冗余理论堆砌,专注于启发思维和提供切实可行的解决方案,让读者能够轻松上手,真正将NLP技术应用于日常生活和工作之中。
图书目录
第1章 导论
1.1 自然语言处理概述
1.1.1 发展过程及未来展望
1.1.2 研究内容与常见应用
1.1.3 NLP基本流程
1.2 NLP的开发环境
1.2.1 Python的优势
1.2.2 NLP开发环境配置
1.3 自然语言与大语言模型
1.3.1 大语言模型的概要与架构
1.3.2 主流的大语言模型
1.3.3 大语言模型的智能问答
小结
课后习题
第2章 文本基础处理
2.1 文本数据源简介
2.2 语料库
2.2.1 语料库的类型
2.2.2 语料库的用途
2.2.3 语料库的构建与获取
2.3 中文分词
2.3.1 常见中文分词方法
2.3.2 基于jieba库的中文分词
2.4 词性标注与命名实体识别
2.4.1 词性标注简介与规范
2.4.2 命名实体识别简介与常用算法
2.4.3 基于jieba库的词性标注与命名实体识别
2.5 关键词提取
2.5.1 常见关键词提取算法
2.5.2 提取文本的关键词
小结
课后习题
第3章 文本预处理与分析
3.1 文本向量化与相似度
3.1.1 文本向量化与相似度简介
3.1.2 常见文本向量化方法
3.1.3 文本向量化实现
3.1.4 常用文本相似度算法
3.1.5 文本相似度算法实现
3.2 文本分析简介
3.2.1 结构化分析
3.2.2 语义化分析
3.3 文本分析常用算法
3.3.1 常用机器学习算法
3.3.2 常用深度学习算法
小结
课后习题
第4章 新闻类型自动分类
4.1 业务背景与项目目标
4.1.1 业务背景
4.1.2 数据说明
4.1.3 分析目标
4.2 分析方法与过程
4.2.1 数据采集
4.2.2 数据探索
4.2.3 文本预处理
4.2.4 构建SVM模型
4.2.5 模型评价
小结
课后习题
第5章 “天问一号”事件的网民评论情感分析
5.1 业务背景与项目目标
5.1.1 业务背景
5.1.2 数据说明
5.1.3 分析目标
5.2 分析方法与过程
5.2.1 数据探索
5.2.2 文本预处理
5.2.3 绘制词云图
5.2.4 使用朴素贝叶斯构建情感分析模型
5.2.5 模型评估
5.2.6 模型优化
小结
课后习题
第6章 游客目的地印象分析
6.1 业务背景与项目目标
6.1.1 业务背景
6.1.2 数据说明
6.1.3 分析目标
6.2 分析方法与流程
6.2.1 数据预处理
6.2.2 目的地印象分析
6.2.3 目的地特色分析
6.2.4 提升景区美誉度的建议
小结
课后习题
第7章 论文标题自动生成
7.1 业务背景与项目目标
7.1.1 业务背景
7.1.2 数据说明
7.1.3 分析目标
7.2 分析方法与流程
7.2.1 数据预处理
7.2.2 训练模型
7.2.3 结果展示与分析
小结
课后习题
第8章 基于TipDM大数据挖掘建模平台的游客目的地印象分析
8.1 TipDM大数据挖掘建模平台简介
8.1.1 共享库
8.1.2 数据连接
8.1.3 数据集
8.1.4 我的工程
8.1.5 个人组件
8.2 使用平台实现游客目的地印象分析
8.2.1 使用平台配置游客目的地印象分析项目的步骤和流程
8.2.2 配置数据源
8.2.3 数据预处理
8.2.4 目的地印象分析
8.2.5 目的地特色分析
小结
课后习题
资源列表
内容筹备中,敬请期待!
视频列表
内容筹备中,敬请期待!
