利用预训练模型
训练卷积神经网络执行图片分类任务通常需要大量的训练数据,而且可能非常耗时,需要数天甚至数周才能完成。但是,如果可以利用基于庞大的数据集(例如通过 TensorFlow-Slim)训练的现有图片模型,并对其进行调整以用于自己的分类任务,会怎么样?
利用预训练模型的一种常见方法是特征提取:检索预训练模型生成的中间表示法,然后将这些表示法馈送到新模型中作为输入。例如,如果您要训练图片分类模型以区分不同类型的蔬菜,可以将胡萝卜、芹菜等图片的训练图片馈送到预训练模型,然后从其最终的卷积层中提取特征。该卷积层会捕获模型学到的所有关于图片的信息,包括将颜色、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、形状、纹理、形状、纹理、形状、纹理、形状、纹理、形状、纹理、形状、纹理、形状、形状、形状、纹理、形状、纹理、形状、形状为了在结合使用特征提取和预训练模型时提高性能,工程师通常会微调应用于所提取特征的权重参数。
有关使用预训练模型时特征提取和微调的更深入探索,请参阅以下练习。