pdf

Python数据分析基础.pdf

  • 1星
  • 日期: 2018-04-01
  • 大小: 13.05MB
  • 所需积分:0分
  • 下载次数:261
  • favicon收藏
  • rep举报
  • 分享
  • free评论
标签: python数据分析

前言..........................................................................................................................................................xi 第 1 章 Python 基础..........................................................................................................................1

1.1 创建 Python 脚本........................................................................................................................1 1.2 运行 Python 脚本........................................................................................................................3 1.3 与命令行进行交互的几项技巧 ................................................................................................. 6 1.4 Python 语言基础要素...............................................................................................................10

1.4.1 数值 ..............................................................................................................................10 1.4.2 字符串 ..........................................................................................................................12 1.4.3 正则表达式与模式匹配 ..............................................................................................16 1.4.4 日期 ..............................................................................................................................19 1.4.5 列表 ..............................................................................................................................21 1.4.6 元组 ..............................................................................................................................26 1.4.7 字典 ..............................................................................................................................27 1.4.8 控制流 ..........................................................................................................................30

1.5 读取文本文件 ........................................................................................................................... 35 1.5.1 创建文本文件 ..............................................................................................................36 1.5.2 脚本和输入文件在同一位置 ......................................................................................38 1.5.3 读取文件的新型语法 ..................................................................................................38

1.6 使用 glob 读取多个文本文件 ................................................................................................. 39 1.7 写入文本文件 ........................................................................................................................... 42 1.7.1 向 first_script.py 添加代码..........................................................................................42 1.7.2 写入 CSV 文件.............................................................................................................45 1.8 print 语句 ................................................................................................................................46 1.9 本章练习 ................................................................................................................................... 47

目录

vii

第 2 章 CSV 文件 ............................................................................................................................48

2.1 基础 Python 与 pandas .............................................................................................................50 2.1.1 读写 CSV 文件(第 1 部分).......................................................................................50 2.1.2 基本字符串分析是如何失败的 ..................................................................................56 2.1.3 读写 CSV 文件(第 2 部分).......................................................................................57

2.2 筛选特定的行 ........................................................................................................................... 58 2.2.1 行中的值满足某个条件 ..............................................................................................59 2.2.2 行中的值属于某个集合 ..............................................................................................60 2.2.3 行中的值匹配于某个模式 / 正则表达式 ...................................................................62

2.3 选取特定的列 ........................................................................................................................... 64 2.3.1 列索引值 ......................................................................................................................64 2.3.2 列标题 ..........................................................................................................................65

2.4 选取连续的行 ........................................................................................................................... 67 2.5 添加标题行 ............................................................................................................................... 69 2.6 读取多个 CSV 文件.................................................................................................................71 2.7 从多个文件中连接数据 ........................................................................................................... 75 2.8 计算每个文件中值的总和与均值 ........................................................................................... 78 2.9 本章练习 ................................................................................................................................... 81

第 3 章 Excel 文件...........................................................................................................................82

3.1 内省 Excel 工作簿....................................................................................................................84 3.2 处理单个工作表 ....................................................................................................................... 88 3.2.1 读写 Excel 文件 ...........................................................................................................88 3.2.2 筛选特定行 ..................................................................................................................92 3.2.3 选取特定列 ..................................................................................................................98 3.3 读取工作簿中的所有工作表 ................................................................................................. 101 3.3.1 在所有工作表中筛选特定行 ....................................................................................102 3.3.2 在所有工作表中选取特定列 ....................................................................................104 3.4 在 Excel 工作簿中读取一组工作表......................................................................................106 3.5 处理多个工作簿 ..................................................................................................................... 108 3.5.1 工作表计数以及每个工作表中的行列计数 ............................................................ 110 3.5.2 从多个工作簿中连接数据 ........................................................................................ 111 3.5.3 为每个工作簿和工作表计算总数和均值 ................................................................ 113 3.6 本章练习 ................................................................................................................................. 117

第 4 章 数据库 ................................................................................................................................ 118

4.1 Python 内置的 sqlite3 模块.................................................................................................119 4.1.1 向表中插入新记录 ....................................................................................................124 4.1.2 更新表中记录 ............................................................................................................128

4.2 MySQL 数据库.......................................................................................................................131 4.2.1 向表中插入新记录 ....................................................................................................135

 viii | 目录

4.2.2 查询一个表并将输出写入 CSV 文件.......................................................................140

4.2.3 更新表中记录 ............................................................................................................142 4.3 本章练习 ................................................................................................................................. 146

第 5 章 应用程序............................................................................................................................147

5.1 在一个大文件集合中查找一组项目 ..................................................................................... 147 5.2 为 CSV 文件中数据的任意数目分类计算统计量...............................................................158 5.3 为文本文件中数据的任意数目分类计算统计量 ................................................................. 167 5.4 本章练习 ................................................................................................................................. 174

第 6 章 图与图表............................................................................................................................175

6.1 matplotlib..............................................................................................................................175 6.1.1 条形图 ........................................................................................................................175 6.1.2 直方图 ........................................................................................................................177 6.1.3 折线图 ........................................................................................................................178 6.1.4 散点图 ........................................................................................................................180 6.1.5 箱线图 ........................................................................................................................181

6.2 pandas .....................................................................................................................................183 6.3 ggplot .....................................................................................................................................184 6.4 seaborn ...................................................................................................................................186

第 7 章 描述性统计与建模..........................................................................................................192

7.1 数据集 ..................................................................................................................................... 192 7.1.1 葡萄酒质量 ................................................................................................................192 7.1.2 客户流失 ....................................................................................................................193

7.2 葡萄酒质量 ............................................................................................................................. 194 7.2.1 描述性统计 ................................................................................................................194 7.2.2 分组、直方图与 t 检验 .............................................................................................195 7.2.3 成对变量之间的关系和相关性 ................................................................................196 7.2.4 使用最小二乘估计进行线性回归 ............................................................................198 7.2.5 系数解释 ....................................................................................................................200 7.2.6 自变量标准化 ............................................................................................................200 7.2.7 预测 ............................................................................................................................202

7.3 客户流失 ................................................................................................................................. 203 7.3.1 逻辑斯蒂回归 ............................................................................................................205 7.3.2 系数解释 ....................................................................................................................207 7.3.3 预测 ............................................................................................................................208

第 8 章 按计划自动运行脚本......................................................................................................209 8.1 任务计划程序(Windows 系统)...........................................................................................209

8.2 cron 工具(macOS 系统和 Unix 系统)................................................................................215 目录 | ix

 

8.2.1 cron 表文件:一次性设置 ........................................................................................216 8.2.2 向 cron 表文件中添加 cron 任务 ..............................................................................216

第 9 章 从这里启航 ....................................................................................................................... 220

9.1 更多的标准库模块和内置函数 ............................................................................................. 221 9.1.1 Python 标准库(PSL):更多的标准模块 .............................................................. 221 9.1.2 内置函数 ....................................................................................................................222

9.2 Python 包索引(PyPI):更多的扩展模块..........................................................................222 9.2.1 NumPy ........................................................................................................................ 223 9.2.2 SciPy ........................................................................................................................... 227 9.2.3 Scikit-Learn ................................................................................................................230 9.2.4 更多的扩展包 ............................................................................................................232

9.3 更多的数据结构 ..................................................................................................................... 232 9.3.1 栈 ................................................................................................................................233 9.3.2 队列 ............................................................................................................................233 9.3.3 图 ................................................................................................................................233 9.3.4 树 ................................................................................................................................234

9.4 从这里启航 ............................................................................................................................. 234 附录 A 下载指南 ............................................................................................................................236

附录 B 练习答案 ............................................................................................................................245 作者介绍..............................................................................................................................................247 封面介绍..............................................................................................................................................247

文档内容节选

cid3524cid2561cid4551cid3686cid2381cid3585 cid3693cid2610cid3360cid3189cid1445cid1480cid4656cid3456cid2752cid4277cid1168cid4264cid4613cid4277cid2394 cid1980cid1546cid273cid2909cid2390cid4187cid4381cid3241cid4201cid3361cid1057cid3336cid273cid4264cid4657 cid2093cid3871cid1995cid1445cid5837cid2475cid3094cid1924cid49cid37cid39cid4359cid1536cid3094cid2249cid3995 cid4359cid1536cid98cid1 cid1420cid2909cid1811cid2713cid1445cid1480cid4656cid3456cid2247cid1794cid2909cid1777cid3238cid3408cid4264cid273 cid3......

(cid:3524)(cid:2561)(cid:4551)(cid:3686)(cid:2381)(cid:3585) (cid:3693)(cid:2610)(cid:3360)(cid:3189)(cid:1445)(cid:1480)(cid:4656)(cid:3456)(cid:2752)(cid:4277)(cid:1168)(cid:4264)(cid:4613)(cid:4277)(cid:2394) (cid:1980)(cid:1546)(cid:273)(cid:2909)(cid:2390)(cid:4187)(cid:4381)(cid:3241)(cid:4201)(cid:3361)(cid:1057)(cid:3336)(cid:273)(cid:4264)(cid:4657) (cid:2093)(cid:3871)(cid:1995)(cid:1445)(cid:5837)(cid:2475)(cid:3094)(cid:1924)(cid:49)(cid:37)(cid:39)(cid:4359)(cid:1536)(cid:3094)(cid:2249)(cid:3995) (cid:4359)(cid:1536)(cid:98)(cid:1) (cid:1420)(cid:2909)(cid:1811)(cid:2713)(cid:1445)(cid:1480)(cid:4656)(cid:3456)(cid:2247)(cid:1794)(cid:2909)(cid:1777)(cid:3238)(cid:3408)(cid:4264)(cid:273) (cid:3779)(cid:2268)(cid:3441)(cid:3203)(cid:273)(cid:1154)(cid:1444)(cid:2249)(cid:3995)(cid:1326)(cid:1132)(cid:98)(cid:1) (cid:3809)(cid:2764)(cid:4347)(cid:4201)(cid:3917)(cid:3984)(cid:1536)(cid:4480)(cid:2318)(cid:4277)(cid:4483)(cid:4130)(cid:1445)(cid:2565)(cid:4521) (cid:1924)(cid:2340)(cid:3841)(cid:273)(cid:4304)(cid:3809)(cid:2764)(cid:1803)(cid:3677)(cid:1036)(cid:1977)(cid:4521)(cid:3405)(cid:1217)(cid:3203)(cid:98) (cid:3266)(cid:1876)(cid:1811)(cid:2713)(cid:4480)(cid:4277)(cid:3155)(cid:3203)(cid:3995)(cid:3769)(cid:273)(cid:3809)(cid:2764)(cid:2390)(cid:2879) (cid:1555)(cid:1726)(cid:4264)(cid:1980)(cid:3404)(cid:3392)(cid:1031)(cid:2451)(cid:1420)(cid:1154)(cid:3915)(cid:4287)(cid:1841)(cid:1086)(cid:1726) (cid:4459)(cid:1916)(cid:1449)(cid:3771)(cid:3203)(cid:1390)(cid:3392)(cid:273)(cid:1129)(cid:2390)(cid:2879)(cid:4628)(cid:2286)(cid:1605)(cid:2672) (cid:4403)(cid:3241)(cid:98) 图 灵 程 序 设 计 丛 书 Python数据分析基础 Foundations for Analytics with Python [美]Clinton W. Brownley 著 陈光欣 译 Beijing • Cambridge • Farnham • Köln • Sebastopol • Tokyo O’Reilly Media, Inc.授权人民邮电出版社出版 人 民 邮 电 出 版 社 北  京 内 容 提 要 本书展示如何用 Python 程序将不同格式的数据处理和分析任务规模化和自动化。主要内容 包括 :Python 基础知识介绍、CSV 文件和 Excel 文件读写、数据库的操作、示例程序演示、图 表的创建,等等。 本书适合数据分析与处理工作相关人员。 ◆ ◆ ◆ 著    [美] Clinton W. Brownley 译    陈光欣 责任编辑 朱 巍 执行编辑 张海艳 责任印制 彭志环 人民邮电出版社出版发行  北京市丰台区成寿寺路11号 邮编 100164  电子邮件 315@ptpress.com.cn 网址 http://www.ptpress.com.cn 北京      印刷 开本:800×1000 1/16 印张:17 字数:402 千字 印数:1 — 4 000册 2017年 8 月第 1 版 2017年 8 月北京第 1 次印刷 著作权合同登记号 图字:01-2017-4510号 定价:69.00元 读者服务热线:(010)51095186转600 印装质量热线:(010)81055316 反盗版热线:(010)81055315 广告经营许可证:京东工商广登字 20170147 号
更多简介内容

推荐帖子

RFID在学校的应用
1、前言 对于校园人力不足,校园腹地广大的条件下,希望由RFID新科技技术,能辅助对提升校园安全维护。凡有现金、票证或需要识别身份的场合(包括学生证、图书借阅证、出入证、教职员工考勤、教职员工会议签到、食堂消费、浴室用水管理、宿舍用电管理、机房收费、停车场、小卖部消费及其它小金额消费等管理功能)均采用这张RFID证件来完成。 2、RFID技术基本原理及应用现状 RFID是Radio
fish001 RF/无线
ESP32-S2开发之坑(5)--利用USB-CDC模拟触摸游标控制littlevgl
  楼主在用littlevgl的时候,没有触摸控制感觉比较不爽,但3.5寸以下大部分又是电阻触摸,所以楼主想着esp32s2有USB,可以通过cdc来模拟触摸,使用的上位机触摸板,用的网上的坛友ntmusic开源的触摸板,也开源了源码,我在此基础上加了个rts,方便对接tinyusb。简单来说就是,把鼠标移入触摸区域,而触摸区域对应了屏幕的触摸区域。每一帧有五个字节,为了方便,第一个字节为鼠标按压
RCSN DIY/开源硬件专区
RF和微波无源元件设计的考虑和限制
     RF和微波无源元件承受许多设计约束和性能指标的负担。根据应用的功率要求,对材料和设计性能的要求可以显着提高。例如,在高功率电信和军用雷达/干扰应用中,需要高性能水平以及极高功率水平。许多材料和技术无法承受这些应用所需的功率水平,因此必须使用专门的组件,材料和技术来满足这些极端的应用要求。 高水平的射频和微波功率是不可见的,难以检测,并且能够在小范围内产生令人难以置信的热量。通常,只有在
火辣西米秀 【无线连接】
4小时实战+剖析(直播):TI工程师教你快速上手 各种无线产品开发
- 想要快速了解现行的各种无线技术(BLE、Zigbee……)和最新无线产品 - 想找专家指点无线产品的硬件设计的基本规则和布板、测试、认证 - 想动手实践多协议下的无线项目 - 最近遇到需要解决手机控制zigbee协议智能家居系统项目,或者对TI 15.4-Stack感兴趣,想研究一下它与其他协议栈区别和开发难度……     >>欢迎点此预约直播,报名即可免费
nmg 【无线连接】
C语言main函数共有多少版本?到底写哪种对?
但凡是学过C语言的人,都知道要先写main函数,然而很多时候我们看到的main函数却各有差异,这究竟是为啥?哪种是对的呢?今天我们就来聊聊main函数。 那么main函数一共有多少个版本呢? 1、main() 直接的mian()并没有返回值,没有入参。这种写法实际来说,部分编译器会显示警告,并且会返回默认值为int。不过在C89标准中其实是可以的,由于没有声明返回类型,所以才会返
Aguilera 【微控制器 MCU】
电路中电能传输方向
  如图(01)这个电路,有两个电池和一个电阻串联。这个电路中,是电池E1对电池E2充电,还是电池E2对电池E1充电?             图(01)   我们测量一下电压U1和电压U2。如果电压U1大于电压U2,就可以判断电阻R左端电位高于右端电位,显然电阻中电流方向是从左向右,如图(02)所示。此时我们就可以判断是电池E1对电池E2充电。当然,如果测量U1和U2结果相反,那就是E2
maychang 综合技术交流

评论

nemon
很实用,用来上手。
2020-04-19 11:48:46回复
Simon_xia
这个书不错,值得一看,谢谢分享
2019-10-22 13:40:04回复
seeyou2night
感谢分享,找了好久才找到。
2019-10-18 17:08:01回复
朱浩波
感谢分享!
2019-08-21 22:26:33回复
taichung
很棒書,值得初學者學習。
2019-07-17 00:00:56回复
学习一下123
感谢分享!!!
2019-05-06 00:15:31回复
Ryan2018
正在学习Python,对初学者非常有帮助,谢谢分享!
2019-02-19 15:01:51回复
biger
很好,赞一个
2018-10-12 17:20:57回复
zouhaiming
感谢分享!编程必备的基础。
2018-09-10 14:42:44回复
fengqiwuc
非常感谢。书很好。
2018-08-22 22:36:38回复
登录/注册

意见反馈

求资源

回顶部

datasheet推荐 换一换

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版 版权声明

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 EEWORLD.com.cn, Inc. All rights reserved
$(function(){ var appid = $(".select li a").data("channel"); $(".select li a").click(function(){ var appid = $(this).data("channel"); $('.select dt').html($(this).html()); $('#channel').val(appid); }) })