Administrator
发布于 2026-05-17 / 2 阅读
0

VGGNet

# 结构 - 输入尺寸:224x224RGB图像 - 预处理:图像每个像素减去RGB平均值 - 卷积步幅为1,保持卷积后分辨率 - 使用最大池化,大小2x2,步幅为2 - 最后是3个全链接层,第一二有4096个神经元,第三个是1000个神经元,对应1000分类,也是soft-max层 - 所有隐藏层使用Relu作为激活函数 - 没有使用数据规范化:认为对于ILSVRC数据集无效,且浪费计算资源 # 配置 VGGNET:共有A-E,五个模型 - 8conv+3fc--------》16conv+3fc, 添加了conv3,或conv1 - 1x1 卷积是在不影响感受域的前提下,增加非线性函数的一种方式 - 滤波器数量64开始,每池化一次,翻倍,直到512 - 使用3x3代替7x7,5x5,减少参数量,增加了激活次数 !\[vggnet\](https://cdn.jsdelivr.net/gh/Dean0731/File@main//image/vggnet.png) \[原文\](https://static.dean0731.top/pdf/article/2020-05/vggnet.pdf)