本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等。本书也涉及神经网络、深度学习、大数据处理等内容。
本书主要内容
第1章 开始数据挖掘之旅 ,介绍我们即将用到的技术,接着通过讲解两个基础算
法的实现方法达到热身目的。
第2章 用 估计器分类 ,涵盖了数据挖掘的一个重要主题——分
类。这一章还会介绍将数据挖掘流程标准化的流水线结构,便于你管理实验流程。
第3章 用决策树预测获胜球队 ,介绍决策树 和随机森林 两个新算法。我们将通过
抽取区分度高的特征来预测获胜选手。
第4章 用亲和性分析方法推荐电影 ,思考根据以往消费记录推荐产品的问题,介
绍Apriori算法。
第5章 用转换器抽取特征 ,介绍不同类别特征的抽取方法及不同数据集的处理方
法。
第6章 使用朴素贝叶斯进行社会媒体挖掘 ,使用朴素贝叶斯算法自动分析来自社
交网站Twitter的文本信息。
第7章 用图挖掘找到感兴趣的人 ,采用聚类和网络分析方法,发现社会媒体上感
1
1
兴趣的人。
第8章 用神经网络破解验证码 ,从图像中抽取信息,然后训练神经网络,用来发
现图像中的单词和字母。
第9章 作者归属问题 ,通过抽取文本特征,使用支持向量机算法,找出文档的作
者。
第10章 新闻语料分类 ,使用k-means聚类算法,根据新闻文章内容进行分类。
第11章 用深度学习方法为图像中的物体进行分类 ,采用深度神经网络算法确定图
像中的物体。
第12章 大数据处理 ,探讨对大数据进行数据挖掘的流程及方法。
附录 依次介绍各章的参考资料,便于读者深入了解各章内容。
猜您喜欢
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
评论