免费阅读

Python网络爬虫技术

江吉彬，张良均；詹增荣，戴华炜，郭信佑

书号：978-7-115-50506-4

本书为大数据应用开发（Python）“1+X”职业技能等级证书配套系列教材。全书以任务为导向，将Python爬虫常用技术和真实案例相结合，介绍使用Python进行数据爬取的主要方法。全书共7章，介绍爬虫的基本概念、前端基础，及在静态网页、动态网页、PC客户端、APP等爬取数据的方法。

本书配套资源(PPT、教案、教学大纲、实训数据等）可登陆泰迪云教材账号，到资源下载处下载。

热度：

申请样书

关注公众号，填写信息，
即可申请样书！

订购咨询

购买

简介

资源下载

视频

上课体验

反馈

图书介绍

1、本书内容契合“1+X”证书制度试点工作中的大数据应用开发（Python）职业技能中级证书考核标准。2、本书设计以“岗位需求为导”对网络爬虫工程师岗位能力进行拆解，并结合案例进行技能教学，贯穿以用为学的教学理念。图书章节编排，结合教师教学需求、特点进行科学合理编排，符合教师教学需要。3、全书以任务为导向，将Python爬虫常用技术和真实案例相结合，介绍使用Python进行数据爬取的主要方法，每一章都由任务描述、任务分析、知识点引入、实训和课后习题5部分组成。4、全书大部分章节紧扣任务需求展开，不堆积知识点，着重于思路的启发与解决方案的实施，通过从任务需求到实现这一完整工作流程的体验，读者将对Python网络爬虫技术真正理解与掌握。

图书目录

第1章 Python爬虫环境与爬虫简介 1

任务1.1   认识爬虫   1
任务1.2   认识反爬虫   5
任务1.3   配置Python爬虫环境   8
小结   28
实训 Python爬虫环境配置   28
课后练习   29

第2章网页前端基础 32

任务2.1   认识Python网络编程   32
任务2.2   认识HTTP协议   39
小结   52
实训使用Socket库连接百度首页   52
课后练习   53

第3章简单静态网页爬取 55

任务3.1   实现HTTP请求   55
任务3.2   解析网页   64
任务3.3   数据存储   87
小结   92
实训   92
课后练习   95

第4章常规动态网页爬取 97

任务4.1   逆向分析爬取动态网页   97
任务4.2   使用Selenium库爬取动态网页   103
任务4.3   存储数据至MongoDB数据库   114
小结   119
实训   119
课后习题   122

第5章模拟登录 123

任务5.1   使用表单登录方法实现模拟登录   123
任务5.2   使用Cookie登录方法实现模拟登录   133
小结   138
实训   138
课后习题   140

第6章终端协议分析 142

任务6.1    分析PC客户端抓包   142
任务6.2    分析APP抓包   147
小结   156
实训   156
课后习题   159

第7章 Scrapy爬虫 160

任务7.1   认识Scarpy   160
任务7.2   通过Scrapy爬取文本信息   164
任务7.3   定制中间件   177
小结   182
实训   183
课后习题   184

附录A 187

附录B 191

参考文献 195

资源列表

文件名	文件大小	上传时间	操作
《Python网络爬虫技术》正文数据及代码	5.94MB	2023-02-21	下载
《Python网络爬虫技术》习题答案	30KB	2023-02-21	下载
《Python网络爬虫技术》PPT课件	8.27MB	2023-02-21	下载
《Python网络爬虫技术》教学大纲	32KB	2023-02-21	下载
《Python网络爬虫技术》教学进度表	20KB	2023-02-21	下载
《Python网络爬虫技术》教案	176KB	2023-02-21	下载

视频列表

1.1.2爬虫的概念 00:04:59 观看

查看全部视频

我们正在全力以赴不断完善本教材的上课体验，但在此期间，您可以优先体验其他教材。感谢您的支持！

Python网络爬虫技术

图书介绍

图书目录

资源列表

视频列表

师资培训

以赛促学

内推就业

教育部1+X

工作室

实验室建设