网站颜色:

深度学习 中文版 deep learning 人工智能机器人学习书籍 张志华

  • 是否是套装:是
  • 书名:深度学习
  • 书名:深度学习

 

D1引言 1

1.1本书面向的读者7

1.2深度学习的历史趋势 8

1.2.1神经网络的众多名称和命运变迁8

1.2.2与日俱增的数据量12

1.2.3与日俱增的模型规模.13

1.2.4与日俱增的精度、复杂度和对现实SJ的冲击  15

 

D1部分应用数学与机器学习基础

D2线性代数 19

2.1标量、向量、矩阵和张量19

2.2矩阵和向量相乘.21

2.3单位矩阵和逆矩阵 22

2.4线性相关和生成子空间23

2.5范数24

2.6特殊类型的矩阵和向量25

2.7特征分解 26

2.8奇异值分解 28

2.9 Moore-Penrose伪逆 28

(咨询特价)迹运算 29

(咨询特价)行列式 30

(咨询特价)实例:主成分分析.30

D3概率与信息论.34

3.1为什么要使用概率 34

3.2随机变量 35

3.3概率分布 36

3.3.1离散型变量和概率质量函数36

3.3.2连续型变量和概率密度函数36

3.4边缘概率 37

3.5条件概率 37

3.6条件概率的链式法则38

3.7D立性和条件D立性38

3.8期望、方差和协方差38

3.9常用概率分布 39

3.9.1 BerDulli分布 40

3.9.2 MultiDulli分布40

3.9.3高斯分布 40

3.9.4指数分布和Laplace分布41

3.9.5 Dirac分布和经验分布42

3.9.6分布的混合 42

(咨询特价)常用函数的有用性质.43

(咨询特价)贝叶斯规则 45

(咨询特价)连续型变量的技术细节45

(咨询特价)信息论 47

(咨询特价)结构化概率模型 49

D4数值计算 52

4.1上溢和下溢 52

4.2病态条件 53

4.3基于梯度的优化方法53

4.3.1梯度之上:JacobianHessian矩阵  56

4.4约束优化 60

4.5实例:线性Z小二乘61

D5机器学习基础.63

5.1学习算法 63

5.1.1任务T  63

5.1.2性能度量P  66

5.1.3经验E  66

5.1.4示例:线性回归 68

5.2容量、过拟合和欠拟合70

5.2.1没有免费午餐定理73

5.2.2正则化 74

5.3超参数和验证集.76

5.3.1交叉验证 76

5.4估计、偏差和方差.77

5.4.1点估计 77

5.4.2偏差 78

5.4.3方差和标准差 80

5.4.4权衡偏差和方差以Z小化均方误差  81

5.4.5一致性 82

5.5Z大似然估计 82

5.5.1条件对数似然和均方误差.84

5.5.2Z大似然的性质 84

5.6贝叶斯统计 85

5.6.1Z大后验(MAP)估计87

5.7监督学习算法 88

5.7.1概率监督学习 88

5.7.2支持向量机 88

5.7.3其他简单的监督学习算法.90

5.8无监督学习算法.91

5.8.1主成分分析 92

5.8.2 k-均值聚类94

5.9随机梯度下降 94

(咨询特价)构建机器学习算法 96

(咨询特价)促使深度学习发展的挑战96

(咨询特价).1维数灾难 97

(咨询特价).2局部不变性和平滑正则化97

(咨询特价).3流形学习 99

 

D2部分深度网络:现代实践

D6深度前馈网络 105

6.1实例:学习XOR 107

6.2基于梯度的学习 110

6.2.1代价函数 111

6.2.2输出单 113

6.3隐藏单.119

6.3.1整流线性单及其扩展120

6.3.2 logistic sigmoid与双曲正切函数  121

6.3.3其他隐藏单 122

6.4架构设计.123

6.4.1WN近似性质和深度.123

6.4.2其他架构上的考虑.126

6.5反向传播和其他的微分算法.126

6.5.1计算图 127

6.5.2微积分中的链式法则.128

6.5.3递归地使用链式法则来实现反向传播  128

6.5.4全连接MLP中的反向传播计算  131

6.5.5符号到符号的导数.131

6.5.6一般化的反向传播.133

6.5.7实例:用于MLP训练的反向传播  .135

6.5.8复杂化 137

6.5.9深度学习界以外的微分137

6.(咨询特价)高阶微分 138

6.6历史小记.139

D7深度学习中的正则化141

7.1参数范数惩罚 142

7.1.1 L2参数正则化 142

7.1.2 L1正则化 144

7.2作为约束的范数惩罚.146

7.3正则化和欠约束问题.147

7.4数据集增强 148

7.5噪声鲁棒性 149

7.5.1向输出目标注入噪声.150

7.6半监督学习 150

7.7多任务学习 150

7.8提前终止.151

7.9参数绑定和参数共享.156

7.9.1卷积神经网络 156

(咨询特价)稀疏表示.157

(咨询特价) Bagging和其他集成方法.158

(咨询特价) Dropout  .159

(咨询特价)对抗训练.165

(咨询特价)切面距离、正切传播和流形正切分类器  167

D8深度模型中的优化169

8.1学习和纯优化有什么不同169

8.1.1经验风险Z小化169

8.1.2代理损失函数和提前终止170

8.1.3批量算法和小批量算法170

8.2神经网络优化中的挑战173

8.2.1病态 173

8.2.2局部J小值 174

8.2.3高原、鞍点和其他平坦区域.175

8.2.4悬崖和梯度炸177

8.2.5长期依赖 177

8.2.6非JQ梯度 178

8.2.7局部和全局结构间的弱对应178

8.2.8优化的理论限制179

8.3基本算法.180

8.3.1随机梯度下降 180

8.3.2动量 181

8.3.3 Nesterov动量.183

8.4参数初始化策略 184

8.5自适应学习率算法 187

8.5.1 AdaGrad  187

8.5.2 RMSProp  188

8.5.3 Adam  189

8.5.4选择正确的优化算法.190

8.6二阶近似方法 190

8.6.1牛顿法 190

8.6.2共轭梯度 191

8.6.3 BFGS 193

8.7优化策略和算法 194

8.7.1批标准化 194

8.7.2坐标下降 196

8.7.3 Polyak平均 197

8.7.4监督预训练 197

8.7.5设计有助于优化的模型199

8.7.6延拓法和课程学习.199

D9卷积网络 201

9.1卷积运算.201

9.2动机 203

9.3池化 207

9.4卷积与池化作为一种无限强的先验  210

9.5基本卷积函数的变体.211

9.6结构化输出 218

9.7数据类型.219

9.8高效的卷积算法 220

9.9随机或无监督的特征.220

(咨询特价)卷积网络的神经科学基础221

(咨询特价)卷积网络与深度学习的历史226

D10序列建模:循环和递归网络227

10.1展开计算图 228

10.2循环神经网络 .230

10.2.1导师驱动过程和输出循环网络  232

10.2.2计算循环神经网络的梯度233

10.2.3作为有向图模型的循环网络235

10.2.4基于上下文的RNN序列建模  237

10.3双向RNN  239

10.4基于编码-解码的序列到序列架构  240

10.5深度循环网络 .242

10.6递归神经网络 .243

10.7长期依赖的挑战 244

10.8回声状态网络 .245

10.9渗漏单和其他多时间尺度的策略  247

10.9.1时间维度的跳跃连接.247

10.9.2渗漏单和一系列不同时间尺度  247

10.9.3删除连接 248

(咨询特价)长短期记忆和其他门控RNN 248

(咨询特价).1 LSTM  248

(咨询特价).2其他门控RNN.250

(咨询特价)优化长期依赖.251

(咨询特价).1截断梯度 251

(咨询特价).2引导信息流的正则化252

(咨询特价)外显记忆 253

D11实践方法论 256

11.1性能度量.256

11.2默认的基准模型 258

11.3决定是否收集更多数据259

11.4选择超参数 259

11.4.1手动调整超参数.259

11.4.2自动超参数优化算法.262

11.4.3网格搜索 262

11.4.4随机搜索 263

11.4.5基于模型的超参数优化264

11.5调试策略.264

11.6示例:多位数字识别267

D12应用.269

12.1大规模深度学习 269

12.1.1快速的CPU实现269

12.1.2 GPU实现 269

12.1.3大规模的分布式实现.271

12.1.4模型压缩 271

12.1.5动态结构 272

12.1.6深度网络的专用硬件实现273

12.2计算机视觉 274

12.2.1预处理 275

12.2.2数据集增强 277

12.3语音识别.278

12.4自然语言处理 .279

12.4.1 n-gram  .280

12.4.2神经语言模型 281

12.4.3高维输出 282

12.4.4结合n-gram和神经语言模型  286

12.4.5神经机器翻译 287

12.4.6历史展望 289

12.5其他应用.290

12.5.1推荐系统 290

12.5.2知识表示、推理和回答292

 

D3部分深度学习研究

D13线性因子模型 297

13.1概率PCA和因子分析297

13.2D立成分分析 .298

13.3慢特征分析 300

13.4稀疏编码.301

13.5 PCA的流形解释 304

D14自编码器 306

14.1欠完备自编码器 306

14.2正则自编码器 .307

14.2.1稀疏自编码器 307

14.2.2去噪自编码器 309

14.2.3惩罚导数作为正则.309

14.3表示能力、层的大小和深度310

14.4随机编码器和解码器.310

14.5去噪自编码器详解311

14.5.1得分估计 312

14.5.2历史展望 314

14.6使用自编码器学习流形314

14.7收缩自编码器 .317

14.8预测稀疏分解 .319

14.9自编码器的应用 319

D15表示学习 321

15.1贪心逐层无监督预训练322

15.1.1何时以及为何无监督预训练有效有效  323

15.2迁移学习和领域自适应326

15.3半监督解释因果关系.329

15.4分布式表示 332

15.5得益于深度的指数增益336

15.6提供发现潜在原因的线索337

D16深度学习中的结构化概率模型339

16.1非结构化建模的挑战.339

16.2使用图描述模型结构.342

16.2.1有向模型 342

16.2.2无向模型 344

16.2.3配分函数 345

16.2.4基于能量的模型.346

16.2.5分离和d-分离347

16.2.6在有向模型和无向模型中转换  350

16.2.7因子图 352

16.3从图模型中采样 353

16.4结构化建模的优势353

16.5学习依赖关系 .354

16.6推断和近似推断 354

16.7结构化概率模型的深度学习方法 .355

16.7.1实例:受限玻尔兹曼机356

D17蒙特卡罗方法 359

17.1采样和蒙特卡罗方法.359

17.1.1为什么需要采样.359

17.1.2蒙特卡罗采样的基础.359

17.2重要采样.360

17.3马尔可夫链蒙特卡罗方法362

17.4 Gibbs采样.365

17.5不同的峰值之间的混合挑战365

17.5.1不同峰值之间通过回火来混合  367

17.5.2深度也许会有助于混合368

D18直面配分函数 369

18.1对数似然梯度 .369

18.2随机Z大似然和对比散度370

18.3伪似然 375

18.4得分匹配和比率匹配.376

18.5去噪得分匹配 .378

18.6噪声对比估计 .378

18.7估计配分函数 .380

18.7.1退火重要采样 382

18.7.2桥式采样 384

D19近似推断 385

19.1把推断视作优化问题.385

19.2期望Z大化 386

19.3Z大后验推断和稀疏编码387

19.4变分推断和变分学习.389

19.4.1离散型潜变量 390

19.4.2变分法 394

19.4.3连续型潜变量 396

19.4.4学习和推断之间的相互作用397

19.5学成近似推断 .397

19.5.1醒眠算法 398

19.5.2学成推断的其他形式.398

D20深度生成模型 399

20.1玻尔兹曼机 399

20.2受限玻尔兹曼机 400

20.2.1条件分布 401

20.2.2训练受限玻尔兹曼机.402

20.3深度信念网络 .402

20.4深度玻尔兹曼机 404

20.4.1有趣的性质 406

20.4.2 DBM均匀场推断406

20.4.3 DBM的参数学习408

20.4.4逐层预训练 408

20.4.5联合训练深度玻尔兹曼机410

20.5实值数据上的玻尔兹曼机413

20.5.1 Gaussian-BerDulli RBM 413

20.5.2条件协方差的无向模型414

20.6卷积玻尔兹曼机 417

20.7用于结构化或序列输出的玻尔兹曼机  418

20.8其他玻尔兹曼机 419

20.9通过随机操作的反向传播419

20.9.1通过离散随机操作的反向传播  420

(咨询特价)有向生成网络.422

(咨询特价).1 sigmoid信念网络422

(咨询特价).2可微生成器网络.423

(咨询特价).3变分自编码器.425

(咨询特价).4生成式对抗网络.427

(咨询特价).5生成矩匹配网络.429

(咨询特价).6卷积生成网络.430

(咨询特价).7自回归网络 430

(咨询特价).8线性自回归网络.430

(咨询特价).9神经自回归网络.431

(咨询特价).10 NADE  432

(咨询特价)从自编码器采样 433

(咨询特价).1与任意去噪自编码器相关的马尔可夫链  434

(咨询特价).2夹合与条件采样.434

(咨询特价).3回退训练过程.435

(咨询特价)生成随机网络.435

(咨询特价).1判别性GSN  436

(咨询特价)其他生成方案.436

(咨询特价)评估生成模型.437

(咨询特价)结论 438

参考文献.439

索引 486

 


内容介绍

《深度学习》由QQ知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是深度学习领域奠基性的经典教材。

全书的内容包括3个部分:D1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;

D2部分系统深入地讲解现今已成熟的深度学习方法和技术;

D3部分讨论某些具有前瞻性的方向和想法,它们被GR为是深度学习未来的研究重点。

《深度学习》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,

以便在实际产品或平台中应用的软件工程师。

我是一个爱书狂,从学前班开始我就对书很痴迷,记的很清楚,妈妈告诉我我要上学了,爸爸去给我买本子了,当时对我来说上学是多么神圣的一件事情,立马变的撒了欢儿死的往路口跑,正好看到爸爸打着伞回来了,迫不及待的从包裹里拿出属于我的东西,不舍得离手,下午我就跟爸爸去了学校交了学费领了书,爸爸回家帮我写了名字并用线装订了一下,上了几个星期,爸爸帮我检查作业,翻开我的书一字没写很干净,不是我不写是我不舍得写,我喜欢里面的画,生怕自己弄脏了,爸爸告诉我只有写上自己的字,做上自己的标记,他才能变的独一无二跟别人的不一样,随后我就格外小心的写,一年后上了一年级,没发书之前就买了封皮,发下书的第一件事就是把封皮套上,然后写上自己的名字,慢慢的养成了一个习惯笔记尽量记在书上,买了很多荧光笔,彩笔,荧光贴,笔记重点我会用不同颜色圈圈画画,时间积累下来书被我记得满满的,还是很有成就感的,我不聪明但我努力,也是这种习惯我考上了重点高中,考上了大学,读了研究生,并且在读研期间发了两篇1SCI,多次参加国内外会议学习之路还是满顺利的。

       喜欢书不仅喜欢里面的文字还喜欢书的形式质感,不同的装订方尸不同的纸张都能带来独一无二的阅读感受,而里面的内容更是让我变的越来越强大,心胸眼界越来越宽广。

每一本书都是一件艺术品,请尊重他们爱惜他们,弃之不如与人。

活到老学到老,希望这些书能帮您实现您的梦想!


热门设计联盟服务商