(特价书)从零开始学Scrapy网络爬虫(视频教学版)
基本信息

编辑推荐
科大讯飞人工智能研究院潘青华、CSDN博客专家贾志刚推荐!科大讯飞人工智能教育培训与研究专家多年经验总结,手把手带领小白从零开始学Scrapy网络爬虫,13个爬虫案例,16小时配套教学视频、教学PPT
编辑推荐:
科大讯飞人工智能教育培训与研究专家多年实战经验的总结
手把手带领“小白”从零开始全面掌握Scrapy网络爬虫的核心技术
以案例为导向,通过对案例的不断迭代和优化,加深读者对知识的理解
超值配书资料:16小时配套教学视频、案例源代码、教学PPT
全面涵盖Python基础、爬虫原理、Scrapy框架、数据库存储、动态页面爬取、模拟登录、反爬虫技术、文件和图片下载、分布式爬虫等内容
选用多个知名且有代表性的网站作为爬取目标,有很强的实用性和可操作性
详解13个综合案例,并重点剖析抢票软件项目的实现原理及实现过程,提高读者解决实际问题的能力
内容简介
计算机书籍
本书从零开始,循序渐进地介绍了目前最流行的网络爬虫框架Scrapy。本书共13章。其中第1~4章为基础篇,介绍了Python基础、网络爬虫基础、Scrapy框架及基本的爬虫功能。第5~10章为进阶篇,介绍了如何将爬虫数据存储于MySQL、MongoDB和Redis数据库中;如何实现异步的Ajax数据的爬取;如何使用Selenium和Splash实现动态网站的爬取;如何实现模拟登录功能;如何突破反爬虫技术,以及如何实现文件和图片的下载。第11~13章为高级篇,介绍了使用Scrapy-Redis实现分布式爬虫;使用Scrapyd和Docker部署分布式爬虫;使用Gerapy管理分布式爬虫,并实现了一个抢票软件的综合项目。
本书适合爬虫初学者、爬虫爱好者及高校相关学生,也适合数据爬虫工程师作为参考读物,同时也适合各大院校和培训机构作为教材使用。
目录
第1篇 基础篇
第1章 Python基础 2
1.1 Python简介 2
1.1.1 Python简史 2
1.1.2 搭建Python环境 3
1.1.3 安装PyCharm集成开发环境 6
1.2 Python基本语法 7
1.2.1 基本数据类型和运算 7
1.2.2 运算符和表达式 8
1.2.3 条件判断语句 9
1.2.4 循环语句 10
1.2.5 字符串 12
1.3 Python内置数据结构 14
1.3.1 列表 15
1.3.2 字典 16
1.3.3 元组 17
1.3.4 遍历对象集合 17
1.4 Python模块化设计 18
1.4.1 函数 18
前言
于是,他们就“怂恿”我,希望我能编写一本从零基础开始学起的网络爬虫书籍。虽然我从事网络爬虫教学工作多年,但我深知教学跟写书是两码事。教学注重临场发挥,思维比较发散;而写书要求文笔流畅、逻辑严谨缜密。我实在没有信心接受这个挑战。直到有一天,机械工业出版社的编辑联系到了我,认为我从事教育和研究工作,能讲、会说、有技术,对写书来说正是最大的优势。于是在编辑的鼓励和指导下,我开始构思和梳理文章脉络:首先,本书受众要广,即使是零基础或非计算机专业的“小白”也能上手;其次,本书内容不追求多和杂,只选用最流行、最好用、最强大的网络爬虫框架介绍即可;最后,本书的可操作性和实用性要强,通过迭代案例加深读者对知识的理解与应用,以典型的、知名的网站为爬取目标,提高读者解决实际问题的能力。本书正是遵循这样的思路逐步推进,不断优化,最后顺利地完成了写作。
本书有何特色
1.由浅入深,循序渐进
本书从零开始,先介绍Python语言、网络爬虫基础、Scrapy框架结构等基础内容;再介绍Scrapy的数据库存储、动态页面爬取、突破反爬虫技术等核心技术;接着介绍分布式爬虫的实现、部署和管理等高级技术;最后介绍了一个完整的综合项目的开发过程。
2.视频教学,讲解详尽
为了便于读者高效、直观地学习,书中每一章的重点内容都专门录制了配套教学视频。读者可以将图书内容和教学视频结合起来,深入、系统地学习,相信一定会取得更好的学习效果。
3.注释详细,一目了然
无论是在Python程序设计,还是在Scrapy爬虫实现部分,本书均对代码做了详细的注释,读者理解起来会更加顺畅。另外,对于多步骤的操作过程,本书在图例中使用数字做了标注,便于读者准确操作。
4.案例丰富,实用易学
本书提供了14个实用性很强的项目案例,这些案例爬取的目标均是知名的、具有代表性的、应用价值较高的网站。读者通过实际操练这些项目案例,可以更加透彻地理解Scrapy网络爬虫的相关知识。
5.提供课件,方便教学
笔者专门为本书制作了专业的教学PPT,以方便相关院校或培训机构的教学人员讲课时使用。
本书内容
第1篇 基础篇
第1章 Python基础
本章介绍了Python环境搭建,并详细介绍了Python基本语法、Python内置数据结构及Python模块化设计,为Scrapy网络爬虫开发打下坚实的编程基础。
第2章 网络爬虫基础
本章介绍了与网络爬虫技术相关的HTTP基本原理、网页基础,以及使用XPath提取网页信息的方法,为Scrapy网络爬虫开发打下坚实的理论基础。
第3章 Scrapy框架介绍
媒体评论
本书从零开始,循序渐进地介绍了目前最流行的网络爬虫框架Scrapy。即使你没有任何编程基础,阅读本书也不会有压力,因为书中有针对性地介绍了Python编程技术。另外,本书在讲解过程中以案例为导向,通过对案例的不断迭代、优化,让读者加深对知识的理解,并通过14个项目案例,提高读者解决实际问题的能力。
本书共13章。其中,第1~4章为基础篇,介绍了Python基础、网络爬虫基础、Scrapy框架及基本的爬虫功能。第5~10章为进阶篇,介绍了如何将爬虫数据存储于MySQL、MongoDB和Redis数据库中;如何实现异步AJAX数据的爬取;如何使用Selenium和Splash实现动态网站的爬取;如何实现模拟登录功能;如何突破反爬虫技术,以及如何实现文件和图片的下载。第11~13章为高级篇,介绍了使用Scrapy-Redis实现分布式爬虫;使用Scrapyd和Docker部署分布式爬虫;使用Gerapy管理分布式爬虫,并实现了一个抢票软件的综合项目。
本书适合爬虫初学者、爱好者及高校相关专业的学生阅读,也适合数据爬虫工程师作为参考读物,同时还适合各大院校和培训机构作为教材使用。
-------------------------------------------------------------------------------------------
业内点评
数据技术的发展进一步促进了人工智能的发展。数据科学随之也成为了一个新的研究方向,很多公司已经有了数据工程师的职位。如何快速地获取数据是每一位数据工程师必须要解决的问题。而Scrapy作为Python开发的爬虫框架,在爬取网站数据和提取结构性数据方面有着独特的优势,需要每个数据技术人员很好地掌握。张涛编写的这本书,系统地介绍了Scrapy框架的相关知识,并给出了多个实践案例,值得每一个数据技术爱好者和工程师阅读。
——科大讯飞人工智能研究院 潘青华
人工智能时代,数据将越来越有价值。各行各业都需要获取大量的数据用于学习和研究,因而高效、快捷的数据获取技术深受青睐。Scrapy爬虫框架是一把获取数据的利器,能让数据的获取变得更加轻松。本书结合十几个爬虫案例,循序渐进地介绍了Scrapy的核心技术,可读性和实用性都很强,是一本不可多得的爬虫技术读物。
——51CTO学院金牌讲师/ CSDN博客专家 贾志刚
作者其它作品
机器人引论
- ¥38.00
- ¥32.30
- 电力电子技术(第2版)
- 电力电子技术