这是一个新思路,4/2
使用resnet的特征去做,这样可以避免信息泄露,但是这样对于整个训练是有问题的。我不能保证学生网络真的去学了所谓的变化信息。