热搜关键词: 电路基础ADC数字信号处理封装库PLC

pdf

python网络数据采集 人民邮电出版社 Ryan Mitchell

  • 1星
  • 2021-01-20
  • 16.7MB
  • 需要1积分
  • 10次下载
标签: python

python

网络数据采集

网络数据采集

本文是美国版本的python网络数据采集参考书,Ryan  Mitchell编著

图灵社区的电子书没有采用专有客
户端,您可以在任意设备上,用自
己喜欢的浏览器和PDF阅读器进行
阅读。
½您购买的电子书仅供您个人½用,
未经授权,不得进行传播。
我们愿意相信读者具有这样的良知
和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可½
对该用户实½包括½不限于关闭该
帐号等维权措½,并可½½究法律
责任。
图灵程序设计丛书
Python
½络数据采集
Web Scraping with Python
Collecting Data from the Modern Web
[美½
Ryan Mitchell
陶俊杰 陈小莉
Beijing • Cambridge • Farnham • Köln • Sebastopol • Tokyo
O’Reilly Media, Inc.授权人民邮电出版社出版
人民邮电出版社
北  京
内 容 提 要
本书采用简洁强大的
Python
语言,介绍了½络数据采集,并为采集新式½络中的各种数据类
型提供了全面的指导。第一部分重点介绍½络数据采集的基本原理 :
如½用
Python
从½络服务器
请求信息,如½对服务器的响应进行基本处理,以及如½以自动化手段与½站进行交互。第二部
分介绍如½用½络爬虫测试½站,自动化处理,以及如½通过更多的方式接入½络。
本书适合需要采集
Web
数据的相关½件开发人员和研究人员阅读。
著    
[
] Ryan Mitchell
译    陶俊杰 陈小莉
责任编辑 岳新欣
执行编辑 李 敏
责任印制 杨林杰
人民邮电出版社出版发行  
北京市丰台区成寿寺路
11
邮编 
100164
  电子邮件 
315@ptpress.com.cn
½址 
http://www.ptpress.com.cn
北京      印刷
开本:
800
×
1000
 
1/16
印张:
13.5
字数:
280
千字
印数:
1
4 000
2016
3
月第
1
2016
3
月北京第
1
次印刷
著½权合同登记号
图字:
01-2015-8108
定价:
59.00
读者服务热线:(010)51095186½600 印装质量热线:(010)81055316
反盗版热线:(010)81055315
广告经营许可证:京崇工商广字第
0021
展开预览

文档解析

《Web Scraping with Python: Collecting Data from the Modern Web》是由Ryan Mitchell所著,陶俊杰和陈小莉翻译的一本专注于网络数据采集的书籍。该书由人民邮电出版社在2016年3月出版,是图灵程序设计丛书的一部分。书中详细介绍了使用Python语言进行网络数据采集的方法和技巧,覆盖了从基本原理到高级技术多个层面。

第一部分主要讲解了网络数据采集的基础知识,如使用Python从服务器请求信息、处理响应、自动化交互等。第二部分则深入探讨了高级数据采集技术,包括数据清洗、自然语言处理、通过网页表单和登录窗口采集数据、JavaScript采集、图像识别与文字处理、避开采集陷阱、使用爬虫测试网站以及远程采集等高级主题。

书中不仅提供了丰富的代码示例和实践指导,还讨论了网络数据采集的法律和道德问题,旨在帮助读者在尊重知识产权的前提下,有效地进行网络数据采集。此外,书中还介绍了一些知名网站的API使用,以及如何与Python结合进行数据处理和存储。通过阅读本书,读者将能够掌握如何利用Python进行有效的网络数据采集,以支持其在软件开发、数据分析和机器学习等领域的工作。

猜您喜欢

评论

登录/注册

意见反馈

求资源

回顶部

推荐内容

热门活动

热门器件

随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved
×