网站首页 文章专栏 《卷积神经网络与计算机视觉》
记得是在周会上看的这本书,但当时没能把关键的地方记录下来。已经过去四五个月了,书的内容早就回忆不来。随手翻了一遍,大概讲了计算机视觉中的传统特征、深度学习基础、已有的框架与一些计算机视觉的应用。
译者序 前言 致谢 作者简介 第1章简介 1.1什么是计算机视觉 1.1.1应用案例 1.1.2图像处理与计算机视觉 1.2什么是机器学习 1.2.1为什么需要深度学习 1.3本书概览 第2章特征和分类器 2.1特征和分类器的重要性 2.1.1特征 2.1.2分类器 2.2传统特征描述符 2.2.1方向梯度直方图 2.2.2尺度不变特征变换 2.2.3加速健壮特征 2.2.4传统的手工工程特征的局限性 2.3机器学习分类器 2.3.1支持向量机 2.3.2随机决策森林 2.4总结 第3章神经网络基础 3.1引言 3.2多层感知机 3.2.1基础架构 3.2.2参数学习 3.3循环神经网络 3.3.1基础架构 3.3.2参数学习 3.4与生物视觉的关联 3.4.1生物神经元模型 3.4.2神经元的计算模型 3.4.3人工神经元与生物神经元 第4章卷积神经网络 4.1引言 4.2神经网络层 4.2.1预处理 4.2.2卷积层 4.2.3池化层 4.2.4非线性 4.2.5全连接层 4.2.6转置卷积层 4.2.7感兴趣区域的池化层 4.2.8空间金字塔池化层 4.2.9局部特征聚合描述符层 4.2.10空间变换层 4.3CNN损失函数 4.3.1交叉熵损失函数 4.3.2SVM铰链损失函数 4.3.3平方铰链损失函数 4.3.4欧几里得损失函数 4.3.51误差 4.3.6对比损失函数 4.3.7期望损失函数 4.3.8结构相似性度量 第5章CNN学习 5.1权重初始化 5.1.1高斯随机初始化 5.1.2均匀随机初始化 5.1.3正交随机初始化 5.1.4无监督的预训练 5.1.5泽维尔(Xavier)初始化 5.1.6ReLU敏感的缩放初始化 5.1.7层序单位方差 5.1.8有监督的预训练 5.2CNN的正则化 5.2.1数据增强 5.2.2随机失活 5.2.3随机失连 5.2.4批量归一化 5.2.5集成模型平均 5.2.62正则化 5.2.71正则化 5.2.8弹性网正则化 5.2.9最大范数约束 5.2.10早停 5.3基于梯度的CNN学习 5.3.1批量梯度下降 5.3.2随机梯度下降 5.3.3小批量梯度下降 5.4神经网络优化器 5.4.1动量 5.4.2涅斯捷罗夫动量 5.4.3自适应梯度 5.4.4自适应增量 5.4.5RMSprop 5.4.6自适应矩估计 5.5CNN中的梯度计算 5.5.1分析微分法 5.5.2数值微分法 5.5.3符号微分法 5.5.4自动微分法 5.6通过可视化理解CNN 5.6.1可视化学习的权重 5.6.2可视化激活 5.6.3基于梯度的可视化 第6章CNN架构的例子 6.1LeNet 6.2AlexNet 6.3NiN 6.4VGGnet 6.5GoogleNet 6.6ResNet 6.7ResNeXt 6.8FractalNet 6.9DenseNet 第7章CNN在计算机视觉中的应用 7.1图像分类 7.1.1PointNet 7.2目标检测与定位 7.2.1基于区域的CNN 7.2.2快速RCNN 7.2.3区域建议网络 7.3语义分割 7.3.1全卷积网络 7.3.2深度反卷积网络 7.3.3DeepLab 7.4场景理解 7.4.1DeepContext 7.4.2从RGBD图像中学习丰富的特征 7.4.3用于场景理解的PointNet 7.5图像生成 7.5.1生成对抗网络 7.5.2深度卷积生成对抗网络 7.5.3超分辨率生成对抗网络 7.6基于视频的动作识别 7.6.1静止视频帧的动作识别 7.6.2双流CNN 7.6.3长期递归卷积网络 第8章深度学习工具和库 8.1Caffe 8.2TensorFlow 8.3MatConvNet 8.4Torch7 8.5Theano 8.6Keras 8.7Lasagne 8.8Marvin 8.9Chainer 8.10PyTorch 第9章结束语 9.1本书概要 9.2未来研究方向 术语表 参考文献