Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

AI人工智能学习大礼包

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 人工智能AI >

实用机器学习 PDF 下载


分享到:
时间:2025-07-28 15:21来源:http://www.java1234.com 作者:转载  侵权举报
实用机器学习
失效链接处理
实用机器学习 PDF 下载

下载地址:
版权归出版社和原作者所有,链接已删除,请购买正版

用户下载说明:

电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
https://product.dangdang.com/11762327913.html
 

相关截图:



资料简介:


本书介绍了实用机器学习的的工作流程,主要从实用角度进行了描述,没有数学公式和推导。本书涵盖了数据收集与处理、模型构建、评价和优化、特征的识别、提取和选择技术、特征工程、数据可视化技术以及模型的部署和安装,结合3个真实案例全面、详细地介绍了整个机器学习的流程。后,还介绍了机器学习的流程的扩展和大数据应用。本书可以作为程序员、数据分析师、统计学家、数据科学家解决实际问题的参考书,也可以作为机器学习的爱好者学习的和应用的参考书,还可以作为非专业学生的机器学习的入门参考书,以及专业学生的实践参考书。



资料目录:

第 1 章 什么是机器学习………………………………………………………………………… 3
1. 1 理解机器学习 ………………………………………………………………………… 3
1. 2 使用数据进行决策 …………………………………………………………………… 6
1. 2. 1 传统方法 ………………………………………………………………………… 6
1. 2. 2 机器学习方法 …………………………………………………………………… ■
1. 2. 3 机器学习的五大优势 …………………………………………………………… 12
1. 2. 4 面临的挑战 ……………………………………………………………………… 12
1. 3 跟踪机器学习流程: 从数据到部署………………………………………………… 13
1. 3. 1 数据集合和预处理 ……………………………………………………………… 13
1. 3. 2 数据构建模型 …………………………………………………………………… 14
1. 3. 3 模型性能评估 …………………………………………………………………… 16
1. 3. 4 模型性能优化 …………………………………………………………………… 16
1. 4 提高模型性能的高级技巧…………………………………………………………… 17
1. 4. 1 数据预处理和特征工程 ………………………………………………………… 17
1. 4. 2 用在线算法持续改进模型………………………………………………………… 18
1. 4. 3 具有数据量和速度的规模化模型 ………………………………………………… 18
1. 5 总结…………………………………………………………………………………… 1■
1. 6 本章术语……………………………………………………………………………… 1■
第 2 章 实用数据处理 ………………………………………………………………………… 20
2. 1 起步: 数据收集……………………………………………………………………… 21
2. 1. 1 应包含哪些特征 ………………………………………………………………… 22
2. 1. 2 如何获得目标变量的真实值 ……………………………………………………… 23
2. 1. 3 需要多少训练数据 ……………………………………………………………… 24
2. 1. 4 训练集是否有足够的代表性 ……………………………………………………… 26
2. 2 数据预处理…………………………………………………………………………… 26
2. 2. 1 分类特征 ………………………………………………………………………… 27
2. 2. 2 缺失数据处理 …………………………………………………………………… 28
2. 2. 3 简单特征工程 …………………………………………………………………… 31
2. 2. 4 数据规范化 ……………………………………………………………………… 32
2. 3 数据可视化…………………………………………………………………………… 33
2. 3. 1 马赛克图 ………………………………………………………………………… 34
2. 3. 2 盒图 …………………………………………………………………………… 35
2. 3. 3 密度图 ………………………………………………………………………… 37
2. 3. 4 散点图 ………………………………………………………………………… 38
2. 4 总结…………………………………………………………………………………… 38
2. 5 本章术语……………………………………………………………………………… 3■
第 3 章 建模和预测 …………………………………………………………………………… 40
3. 1 基础机器学习建模…………………………………………………………………… 40
3. 1. 1 寻找输入和目标间的关系………………………………………………………… 41
3. 1. 2 寻求好模型的目的 ……………………………………………………………… 42
3. 1. 3 建模方法类型 …………………………………………………………………… 43
3. 1. 4 有监督和无监督学习 …………………………………………………………… 44
3. 2 分类: 把数据预测到桶中…………………………………………………………… 45
3. 2. 1 构建分类器并预测 ……………………………………………………………… 46
3. 2. 2 非线性数据与复杂分类 ………………………………………………………… 4■
3. 2. 3 多类别分类 ……………………………………………………………………… 51
3. 3 回归: 预测数值型数据……………………………………………………………… 52
3. 3. 1 构建回归器并预测 ……………………………………………………………… 54
3. 3. 2 对复杂的非线性数据进行回归 …………………………………………………… 56
3. 4 总结…………………………………………………………………………………… 57
3. 5 本章术语……………………………………………………………………………… 58
第 4 章 模型评估与优化 ……………………………………………………………………… 5■
4. 1 模型泛化: 评估新数据的预测准确性……………………………………………… 60
4. 1. 1 问题: 过度拟合与乐观模型 ……………………………………………………… 60
4. 1. 2 解决方案: 交叉验证 …………………………………………………………… 62
4. 1. 3 交叉验证的注意事项 …………………………………………………………… 65
4. 2 分类模型评估………………………………………………………………………… 66
4. 2. 1 分类精度和混淆矩阵 …………………………………………………………… 68
4. 2. 2 准确度权衡与 ROC 曲线 ………………………………………………………… 68
4. 2. 3 多类别分类 ……………………………………………………………………… 71
4. 3 回归模型评估………………………………………………………………………… 74
4. 3. 1 使用简单回归性能指标 ………………………………………………………… 75
4. 3. 2 检验残差 ………………………………………………………………………… 76
4. 4 参数调整优化模型…………………………………………………………………… 77
4. 4. 1 机器学习算法和它们的调整参数 ………………………………………………… 77
4. 4. 2 网格搜索 ………………………………………………………………………… 78
4. 5 总结…………………………………………………………………………………… 81
4. 6 本章术语……………………………………………………………………………… 82
第 5 章 基础特征工程 ………………………………………………………………………… 83
5. 1 动机: 为什么特征工程很有用……………………………………………………… 83
5. 1. 1 什么是特征工程 ………………………………………………………………… 83
5. 1. 2 使用特征工程的 5 个原因………………………………………………………… 84
5. 1. 3 特征工程与领域专业知识………………………………………………………… 85
5. 2 基本特征工程过程…………………………………………………………………… 86
5. 2. 1 实例: 事件推荐 ………………………………………………………………… 86
5. 2. 2 处理日期和时间特征 …………………………………………………………… 87
5. 2. 3 处理简单文本特征 ……………………………………………………………… 8■
5. 3 特征选择……………………………………………………………………………… ■1
5. 3. 1 前向选择和反向消除 …………………………………………………………… ■3
5. 3. 2 数据探索的特征选择 …………………………………………………………… ■4
5. 3. 3 实用特征选择实例 ……………………………………………………………… ■5
5. 4 总结…………………………………………………………………………………… ■8
5. 5 本章术语……………………………………………………………………………… ■8
第 2 部分 实 际 应 用
第 6 章 案例: NYC 出租车数据 …………………………………………………………… 103
6. 1 数据: NYC 出租车旅程和收费信息 ……………………………………………… 103
6. 1. 1 数据可视化 …………………………………………………………………… 104
6. 1. 2 定义问题并准备数据 …………………………………………………………… 107
6. 2 建模 ………………………………………………………………………………… 10■
6. 2. 1 基本线性模型 ………………………………………………………………… 10■
6. 2. 2 非线性分类器 ………………………………………………………………… 111
■6. 2. 3 包含分类特征 ………………………………………………………………… 112
6. 2. 4 包含日期 - 时间特征 …………………………………………………………… 113
6. 2. 5 模型的启示 …………………………………………………………………… 114
6. 3 总结 ………………………………………………………………………………… 115
6. 4 本章术语 …………………………………………………………………………… 116
第 7 章 高级特征工程………………………………………………………………………… 117
7. 1 高级文本特征 ……………………………………………………………………… 117
7. 1. 1 词袋模型 ……………………………………………………………………… 117
7. 1. 2 主题建模 ……………………………………………………………………… 11■
7. 1. 3 内容拓展 ……………………………………………………………………… 122
7. 2 图像特征 …………………………………………………………………………… 123
7. 2. 1 简单图像特征 ………………………………………………………………… 123
7. 2. 2 提取物体和形状………………………………………………………………… 125
7. 3 时间序列特征 ……………………………………………………………………… 128
7. 3. 1 时间序列数据的类型 …………………………………………………………… 128
7. 3. 2 时间序列数据的预测 …………………………………………………………… 130
7. 3. 3 经典时间序列特征 ……………………………………………………………… 131
7. 3. 4 事件流的特征工程 ……………………………………………………………… 135
7. 4 总结 ………………………………………………………………………………… 135
7. 5 本章术语 …………………………………………………………………………… 136
第 8 章 NLP 高级案例: 电影评论情感预测 ……………………………………………… 138
8. 1 研究数据和应用场景 ……………………………………………………………… 138
8. 1. 1 数据集初探 …………………………………………………………………… 13■
8. 1. 2 检查数据 ……………………………………………………………………… 13■
8. 1. 3 应用场景有哪些………………………………………………………………… 140
8. 2 提取基本 NLP 特征并构建初始模型 ……………………………………………… 142
8. 2. 1 词袋特征 ……………………………………………………………………… 143
8. 2. 2 用朴素贝叶斯算法构建模型 …………………………………………………… 144
8. 2. 3 tf - idf 算法规范词袋特征 ……………………………………………………… 147
8. 2. 4 优化模型参数 ………………………………………………………………… 148
8. 3 高级算法和模型部署的考虑 ……………………………………………………… 152
8. 3. 1 word2vec 特征…………………………………………………………………… 152
8. 3. 2 随机森林模型 ………………………………………………………………… 154
8. 4 总结 ………………………………………………………………………………… 156
8. 5 本章术语 …………………………………………………………………………… 156
第 9 章 扩展机器学习流程…………………………………………………………………… 157
■. 1 扩展前需考虑的问题 ……………………………………………………………… 157
■■. 1. 1 识别关键点 …………………………………………………………………… 158
■. 1. 2 选取训练数据子样本代替扩展性………………………………………………… 15■
■. 1. 3 可扩展的数据管理系统 ………………………………………………………… 160
■. 2 机器学习建模流程扩展 …………………………………………………………… 162
■. 3 预测扩展 …………………………………………………………………………… 165
■. 3. 1 预测容量扩展 ………………………………………………………………… 166
■. 3. 2 预测速度扩展 ………………………………………………………………… 166
■. 4 总结 ………………………………………………………………………………… 168
■. 5 本章术语 …………………………………………………………………………… 16■
第 10 章 案例: 数字显示广告 ……………………………………………………………… 170
10. 1 显示广告…………………………………………………………………………… 170
10. 2 数字广告数据……………………………………………………………………… 171
10. 3 特征工程和建模策略……………………………………………………………… 172
10. 4 数据大小和形状…………………………………………………………………… 173
10. 5 奇异值分解………………………………………………………………………… 175
10. 6 资源估计和优化…………………………………………………………………… 177
10. 7 建模………………………………………………………………………………… 178
10. 8 K 近邻算法………………………………………………………………………… 178
10. ■ 随机森林算法……………………………………………………………………… 180
10. 10 其他实用考虑 …………………………………………………………………… 181
10. 11 总结 ……………………………………………………………………………… 182
10. 12 本章术语 ………………………………………………………………………… 183
10. 13 摘要和结论 ……………………………………………………………………… 183
 



------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐