
Python网络爬虫:从入门到精通
教材教辅研究生/本科/专科教材11.2万字
更新时间:2023-10-25 19:34:57 最新章节:参考文献
书籍简介
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
吕云翔主编
- 会员本书结合了Python3.6的新特性,完全为零基础的初学者量身定做。书中例举大量实例,介绍了Python的基本语法、编码规范和一些编程思想。本书第1~8章为Python语言基础,主要介绍Python的基本用法;第9章为一个实战,帮助读者理解前8章的知识;第10~17章为Python的进阶使用,包含面向对象编程、函数式编程入门、文件读写、异常处理、模块和包几个部分;第18章为第2个实战,帮助读者融高教教材8.4万字
同类热门书
最新上架
- 会员本系列教材是国内首套虚拟现实设计系统专业教材,融合策划、艺术设计、三维制作、引擎开发等环节的关键技术,聚焦虚拟现实内容设计过程中的专业问题,以高质量虚拟现实内容的制作实现为目标进行系统的课程内容设计。理论与实践结合,以行业成功案例为素材指导学生在较短的时间里掌握虚拟现实内容设计的整体流程和关键技术。本系列教材囊括了高水平虚拟现实内容设计的各关键环节,形成虚拟现实内容设计制作的产业链条的闭环,完整地教材教辅5.2万字
- 会员当前,互联网产品已经融入社会生产生活的方方面面,越来越深刻地影响着人们的学习、工作和生活。与此同时,互联网产品开发也已成为互联网从业人员及创业者关注的热点领域。本书系统阐述了互联网产品开发的相关知识,主要内容包括互联网产品概述、互联网产品开发流程和工具、产品需求分析、产品规划、产品原型设计、产品开发和测试、产品发布和推广、产品迭代等。本书内容覆盖面广,各项目既相互关联又相对独立,理论讲解与案例实操教材教辅8.5万字
- 会员在数字时代背景下,全媒体运营通过整合多种媒体平台和渠道,能够实现品牌或产品的全方位推广与精准营销。本书系统地介绍了全媒体运营的策略、方法与技巧,具体内容分为8个项目,分别是全媒体运营概述、全媒体运营必备技能、全媒体运营策划与传播、全媒体内容运营、全媒体用户运营、短视频运营、直播运营和全媒体运营管理。本书内容新颖、案例丰富,既可作为高等院校新媒体类、电子商务类、新闻传播类等相关专业的学习教材,也可供教材教辅16.4万字
同类书籍最近更新
- 会员本书是在第四版的基础上修订而成。本次修订主要从以下四个方面对原书进行完善:一是更新了全书60多个案例,均采用近两年市场营销的典型案例。二是部分章节根据大数据的发展修订了一些章节的内容:主要体现在第三章,第四章和第八章。三是修改全书实训内容并增加了拓展资源:包括案例讨论、实训、课堂小游戏和练习题库。四是修订了书中部分内容的表述,更换了部分图表和思维导图。修订后的教材更适合市场营销专业师生的教与学,也高教教材22.2万字