DG-Net

DG-Net 是一个深度学习项目,专注于利用生成数据辅助训练行人重识别模型。通过交换行人图像特征生成高质量训练数据,无需额外标注即可提升模型效果。

Check out DG-Net on CurateClick

• Copy the embed code to showcase this product on your website

• Share on X to spread the word about this amazing tool

项目推荐- 项目地址:https://github.com/NVlabs/DG-Net- 类别:Python / 机器学习 / 计算机视觉- 项目后续更新计划:每周更新 - 项目描述:深度学习模型训练时往往需要大量的标注数据,但收集和标注大量的数据往往比较困难。作者在行人重识别这个任务上探索了 利用生成数据来辅助训练的方法。通过生成高质量的行人图像(行人两两换衣),将其与行人重识别模型融合,同时提升行人生成的质量和行人重识别的精度。- 推荐理由:1. 不需要额外标注(如姿态 pose,属性 attribute,关键点 keypoints 等),就能生成高质量行人图像。通过交换提取出的特征,来实现两张行人图像的外表互换。这些外表都是训练集中真实存在的变化,而不是随机噪声。 2. 不需要部件匹配来提升行人重识别的结果。仅仅是让模型看更多训练样本就可以提升模型的效果。给定 N 张图像,我们首先生成了 NxN 的训练图像,用这些图像来训练行人重识别模型。(下图第一行和第一列为真实图像输入,其余都为生成图像)3. 训练中存在一个循环: 生成图像喂给行人重识别模型来学习好的行人特征,而行人重识别模型提取出来的特征也会再喂给生成模型来提升生成图像的质量。- 介绍视频:Youtube:https://www.youtube.com/watch?v=ubCrEAIpQs4Bilibili:https://www.bilibili.com/video/av51439240- 示例代码:Start trainingbashpython train.py --config configs/latest.yamlOr training with low precision float (float16)bashpython train.py --config configs/latest-fp16.yamlIntermediate image outputs and model binary files are stored in outputs/latest.Check the loss logbash tensorboard --logdir logs/latest- 截图:https://github.com/layumi/DGNet/blob/master/NxN.jpg?raw=true