热搜关键词: 信号与系统无刷电机ADSTCP/IP

pdf

深入浅出Python机器学习

  • 1星
  • 日期: 2022-06-19
  • 大小: 176.39MB
  • 所需积分:1分
  • 下载次数:0
  • favicon收藏
  • rep举报
  • free评论
标签: python

python

机器学习

机器学习

机器学习正在迅速改变我们的世界。我们几乎每天都会读到机器学习如何改变日常的生活。如果你在淘宝或者京东这样的电子商务网站购买商品,或者在爱奇艺或是腾讯视频这样的视频网站观看节目,甚至只是进行一次百度搜索,就已经触碰到了机器学习的应用。使用这些服务的用户会产生数据,这些数据会被收集,在进行预处理之后用来训练模型,而模型会通过这些数据来提供更好的用户体验。此外,目前还有很多使用机器学习技术的产品或服务即将在我们的生活当中普及,如能够解放双手的无人驾驶汽车、聪明伶俐的智能家居产品、善解人意的导购机器人等。可以说要想深入机器学习的应用开发当中,现在就是一个非常理想的时机。

本书内容涵盖了有监督学习、无监督学习、模型优化、自然语言处理等机器学习领域所必须掌握的知识,从内容结构上非常注重知识的实用性和可操作性。全书采用由浅入深、循序渐进的讲授方式,完全遵循和尊重初学者对机器学习知识的认知规律。本书适合有一定程序设计语言和算法基础的读者学习使用。

目  录

第1章  概  述

1.1  什么是机器学习——从一个小故事开始  /  002

1.2  机器学习的一些应用场景——蝙蝠公司的业务单元  /  003

1.3  机器学习应该如何入门——世上无难事  /  005

1.4  有监督学习与无监督学习  /  007

1.5  机器学习中的分类与回归  /  008

1.6  模型的泛化、过拟合与欠拟合  /  008

1.7  小结  /  009

第2章  基于Python语言的环境配置

2.1  Python的下载和安装  /  012

2.2  Jupyter  Notebook的安装与使用方法  /  013

2.2.1  使用pip进行Jupyter  Notebook的下载和安装  /  013

2.2.2  运行Jupyter  Notebook  /  014

2.2.3  Jupyter  Notebook的使用方法  /  015

2.3  一些必需库的安装及功能简介  /  017

2.3.1  Numpy——基础科学计算库  /  017

2.3.2  Scipy——强大的科学计算工具集  /  018

2.3.3  pandas——数据分析的利器  /  019

2.3.4  matplotlib——画出优美的图形  /  020

深入浅出Python  机器学习

VIII

2.4  scikit-learn——非常流行的Python机器学习库  /  021

2.5  小结  /  022

第3章  K最近邻算法——近朱者赤,近墨者黑

3.1  K最近邻算法的原理  /  024

3.2  K最近邻算法的用法  /  025

3.2.1  K最近邻算法在分类任务中的应用  /  025

3.2.2  K最近邻算法处理多元分类任务  /  029

3.2.3  K最近邻算法用于回归分析  /  031

3.3  K最近邻算法项目实战——酒的分类  /  034

3.3.1  对数据集进行分析  /  034

3.3.2  生成训练数据集和测试数据集  /  036

3.3.3  使用K最近邻算法进行建模  /  038

3.3.4  使用模型对新样本的分类进行预测  /  039

3.4  小结  /  041

第4章  广义线性模型——“耿直”的算法模型

4.1  线性模型的基本概念  /  044

4.1.1  线性模型的一般公式  /  044

4.1.2  线性模型的图形表示  /  045

4.1.3  线性模型的特点  /  049

4.2  最基本的线性模型——线性回归  /  050

4.2.1  线性回归的基本原理  /  050

4.2.2  线性回归的性能表现  /  051

4.3  使用L2正则化的线性模型——岭回归  /  053

4.3.1  岭回归的原理  /  053

4.3.2  岭回归的参数调节  /  054

4.4  使用L1正则化的线性模型——套索回归  /  058

4.4.1  套索回归的原理  /  058

4.4.2  套索回归的参数调节  /  059

4.4.3  套索回归与岭回归的对比  /  060

IX

4.5  小结  /  062

第5章  朴素贝叶斯——打雷啦,收衣服啊

5.1  朴素贝叶斯基本概念  /  064

5.1.1  贝叶斯定理  /  064

5.1.2  朴素贝叶斯的简单应用  /  064

5.2  朴素贝叶斯算法的不同方法  /  068

5.2.1  贝努利朴素贝叶斯  /  068

5.2.2  高斯朴素贝叶斯  /  071

5.2.3  多项式朴素贝叶斯  /  072

5.3  朴素贝叶斯实战——判断肿瘤是良性还是恶性  /  075

5.3.1  对数据集进行分析  /  076

5.3.2  使用高斯朴素贝叶斯进行建模  /  077

5.3.3  高斯朴素贝叶斯的学习曲线  /  078

5.4  小结  /  080

第6章  决策树与随机森林——会玩读心术的算法

6.1  决策树  /  082

6.1.1  决策树基本原理  /  082

6.1.2  决策树的构建  /  082

6.1.3  决策树的优势和不足  /  088

6.2  随机森林  /  088

6.2.1  随机森林的基本概念  /  089

6.2.2  随机森林的构建  /  089

6.2.3  随机森林的优势和不足  /  092

6.3  随机森林实例——要不要和相亲对象进一步发展  /  093

6.3.1  数据集的准备  /  093

6.3.2  用get_dummies处理数据  /  094

6.3.3  用决策树建模并做出预测  /  096

6.4  小结  /  098

第7章  支持向量机SVM——专治线性不可分

7.1  支持向量机SVM基本概念  /  100

7.1.1  支持向量机SVM的原理  /  100

7.1.2  支持向量机SVM的核函数  /  102

7.2  SVM的核函数与参数选择  /  104

7.2.1  不同核函数的SVM对比  /  104

7.2.2  支持向量机的gamma参数调节  /  106

7.2.3  SVM算法的优势与不足  /  108

7.3  SVM实例——波士顿房价回归分析  /  108

7.3.1  初步了解数据集  /  109

7.3.2  使用SVR进行建模  /  110

7.4  小结  /  114

第8章  神经网络——曾入“冷宫”,如今得宠

8.1  神经网络的前世今生  /  116

8.1.1  神经网络的起源  /  116

8.1.2  第一个感知器学习法则  /  116

8.1.3  神经网络之父——杰弗瑞·欣顿  /  117

8.2  神经网络的原理及使用  /  118

8.2.1  神经网络的原理  /  118

8.2.2  神经网络中的非线性矫正  /  119

8.2.3  神经网络的参数设置  /  121

8.3  神经网络实例——手写识别  /  127

8.3.1  使用MNIST数据集  /  128

8.3.2  训练MLP神经网络  /  129

8.3.3  使用模型进行数字识别  /  130

8.4  小结  /  131

第9章  数据预处理、降维、特征提取及聚类——快

刀斩乱麻

9.1  数据预处理  /  134

9.1.1  使用StandardScaler进行数据预处理  /  134

9.1.2  使用MinMaxScaler进行数据预处理  /  135

9.1.3  使用RobustScaler进行数据预处理  /  136

9.1.4  使用Normalizer进行数据预处理  /  137

9.1.5  通过数据预处理提高模型准确率  /  138

9.2  数据降维  /  140

9.2.1  PCA主成分分析原理  /  140

9.2.2  对数据降维以便于进行可视化  /  142

9.2.3  原始特征与PCA主成分之间的关系  /  143

9.3  特征提取  /  144

9.3.1  PCA主成分分析法用于特征提取  /  145

9.3.2  非负矩阵分解用于特征提取  /  148

9.4  聚类算法  /  149

9.4.1  K均值聚类算法  /  150

9.4.2  凝聚聚类算法  /  153

9.4.3  DBSCAN算法  /  154

9.5  小结  /  157

第10章  数据表达与特征工程——锦上再添花

10.1  数据表达  /  160

10.1.1  使用哑变量转化类型特征  /  160

10.1.2  对数据进行装箱处理  /  162

10.2  数据“升维”  /  166

10.2.1  向数据集添加交互式特征  /  166

10.2.2  向数据集添加多项式特征  /  170

10.3  自动特征选择  /  173

10.3.1  使用单一变量法进行特征选择  /  173

10.3.2  基于模型的特征选择  /  178

10.3.3  迭代式特征选择  /  180

10.4  小结  /  182

第11章  模型评估与优化——只有更好,没有最好

11.1  使用交叉验证进行模型评估  /  184

11.1.1  scikit-learn中的交叉验证法  /  184

11.1.2  随机拆分和“挨个儿试试”  /  186

11.1.3  为什么要使用交叉验证法  /  188

11.2  使用网格搜索优化模型参数  /  188

11.2.1  简单网格搜索  /  189

11.2.2  与交叉验证结合的网格搜索  /  191

11.3  分类模型的可信度评估  /  193

11.3.1  分类模型中的预测准确率  /  194

11.3.2  分类模型中的决定系数  /  197

11.4  小结  /  198

第12章  建立算法的管道模型——团结就是力量

12.1  管道模型的概念及用法  /  202

12.1.1  管道模型的基本概念  /  202

12.1.2  使用管道模型进行网格搜索  /  206

12.2  使用管道模型对股票涨幅进行回归分析  /  209

12.2.1  数据集准备  /  209

12.2.2  建立包含预处理和MLP模型的管道模型  /  213

12.2.3  向管道模型添加特征选择步骤  /  214

12.3  使用管道模型进行模型选择和参数调优  /  216

12.3.1  使用管道模型进行模型选择  /  216

12.3.2  使用管道模型寻找更优参数  /  217

12.4  小结  /  220

第13章  文本数据处理——亲,见字如“数”

13.1  文本数据的特征提取、中文分词及词袋模型  /  222

13.1.1  使用CountVectorizer对文本进行特征提取  /  222

13.1.2  使用分词工具对中文文本进行分词  /  223

13.1.3  使用词袋模型将文本数据转为数组  /  224

13.2  对文本数据进一步进行优化处理  /  226

13.2.1  使用n-Gram改善词袋模型  /  226

13.2.2  使用tf-idf模型对文本数据进行处理  /  228

13.2.3  删除文本中的停用词  /  234

13.3  小结  /  236

第14章  从数据获取到话题提取——从“研究员”

到“段子手”

14.1  简单页面的爬取  /  238

14.1.1  准备Requests库和User  Agent  /  238

14.1.2  确定一个目标网站并分析其结构  /  240

14.1.3  进行爬取并保存为本地文件  /  241

14.2  稍微复杂一点的爬取  /  244

14.2.1  确定目标页面并进行分析  /  245

14.2.2  Python中的正则表达式  /  247

14.2.3  使用BeautifulSoup进行HTML解析  /  251

14.2.4  对目标页面进行爬取并保存到本地  /  256

14.3  对文本数据进行话题提取  /  258

14.3.1  寻找目标网站并分析结构  /  259

14.3.2  编写爬虫进行内容爬取  /  261

14.3.3  使用潜在狄利克雷分布进行话题提取  /  263

14.4  小结  /  265

第15章  人才需求现状与未来学习方向——你是不

是下一个“大牛”

15.1  人才需求现状  /  268

15.1.1  全球AI从业者达190万,人才需求3年翻8倍  /  268

15.1.2  AI人才需求集中于一线城市,七成从业者月薪过万  /  269

15.1.3  人才困境仍难缓解,政策支援亟不可待  /  269

15.2  未来学习方向  /  270

15.2.1  用于大数据分析的计算引擎  /  270

15.2.2  深度学习开源框架  /  271

15.2.3  使用概率模型进行推理  /  272

15.3  技能磨炼与实际应用  /  272

15.3.1  Kaggle算法大赛平台和OpenML平台  /  272

15.3.2  在工业级场景中的应用  /  273

15.3.3  对算法模型进行A/B测试  /  273

15.4  小结  /  274

参考文献  /  275

推荐帖子 最新更新时间:2022-06-19 08:48

一张图让你了解TE的多款工业电机传感器
摘自TE微信:https://mp.weixin.qq.com/s/6A8DgsLCdPG-8GbvFenRsg 还想进一步了解,欢迎点此预约9月6日(下周五)的TE“传感器在工业电机里的发展及最新应用”主题直播,还有直播小礼品等你来。   其他推荐: 有任何问题,推荐扫描下方二维码,微信与TE客服高效聊天。同时欢迎网友分享你与TE客服的聊天截图或者你提问的问题截图
nmg 综合技术交流
文件截短
Linux提供了两个系统调用支持文件长度截短,分别是: #include #include int ftruncate(int fd,off_t len); 和: #include #include int truncate(const char *path,off_t len); 这两个系统调用都将给定文件截短为参数len指定的长度。ftruncate()系统调用在已
chenbingjy Linux与安卓
MSP430F149为核心的温度检测仪的设计
      兰州大型的综合工程重离子加速器——冷却存储环(HIFRL-CSR)是国家科学重点工程之一,在其内部控制系统里存在着大量的测量温度的场合,这些场合依靠约束离子的行为发挥CSR主环中的磁场作用,在磁场中,这些带电粒子束有时处于聚焦状态,有时则处于传输状态,且磁场性能的好坏对束流品质有直接影响。 由于磁铁的温度与磁场性能及安全密切相关。磁铁的线圈中通过电流时,会产生很高的温度,因此,对其温
Jacktang 微控制器 MCU
C6678的SPI Flash启动失败
XX板上的6678使用I2C外接其他主机启动。但设计时保留了Nor Flash启动方式作为备份启动方式,因此需要调试SPI Flash启动。 6678支持多种启动方式,在《Bootloader for the C66x DSP User Guide(sprugy5b)》中都有描述。不同的启动方式由上电时启动模式引脚的状态配置,XX板上在研发阶段采用了拨码配置。 根据手册说明,需要先生成
Aguilera DSP 与 ARM 处理器
【NUCLEO-L552ZE测评】开箱与板载资源分析
本帖最后由 hzz592788 于 2020-12-22 17:59 编辑         在我心爱的可爱的win10再次崩盘导致我重装一堆软件之后,怀着美妙的心情写个开箱贴。 1、外观         感谢eeworld给我嫖板的机会,板子很漂亮。不亏是大厂的东西,我喜欢。 2、资源分析 一、ST-Link V2-1         NUCLE
hzz592788 开发板测评专版
增量式编码器变绝对值编码器的方法
  绝对值编码器凭借着“光刻”般密集的蚀刻密度,使用得在直径方向和“圆周方向”都可以蚀刻出非常密集的通道。 凭借着上述技能,带来了2大好处:一是一圈分辩率大提高,二是能够通过“格雷码”来实时记录绝对值地,不受断电影响,而且无须额外电源。 第1点,一圈的分辩率这个是先天性的,基本无法改, 我想,第2点我们是有办法可以改变的,只要我们额外增加一个EEPROM或FLASH,
vincent.liu 电机驱动控制(Motor Control)

评论

登录/注册

意见反馈

求资源

回顶部
查找数据手册?

EEWorld Datasheet 技术支持

热门活动

相关视频

可能感兴趣器件

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版 版权声明

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2022 EEWORLD.com.cn, Inc. All rights reserved
×