本书讲解了如何使用Python来编写网路爬虫程式,内容包括网路爬虫简介,从页面中抓取资料的3种方法,提取缓存中的资料,使用多个执行绪和进程进行併发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行资料抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,旨在説明读者活学活用书中介绍的技术。
本书适合有一定Python程式设计经验而且对爬虫技术感兴趣的读者阅读。
推荐帖子 最新更新时间:2023-01-30 17:09
EEWorld Datasheet 技术支持
热门活动
相关视频
可能感兴趣器件
随便看看
热门下载
热门文章
热门标签
评论