计算机视觉学习记录
避免重复造轮子
CNN中的注意力机制 CNN中的注意力机制
通道注意力机制SENetSENet(Squeeze-and-Excitation Networks,SENet)是ImageNet2017分类比赛的冠军模型,主要思想为对H×W×C的feature map进行处理,得到一个1×1×C的权重,
2020-05-14
Distilling Knowledge from Refinement in MLDN Distilling Knowledge from Refinement in MLDN
摘要基于MIL的弱监督目标检测方法通常从一组候选区域中选择得分最高的实例,然后再根据IoU取其相近区域。在本篇文章中,作者提出了一种自适应监督聚合函数(adaptive supervision aggregation function),可
2020-05-12
Grad-CAM解析 Grad-CAM解析
采用VGG16等分类模型,计算输入图像的特征图、预测类别及预测类别得分,通过对某预测类别的特征图进行加权求和,再通过ReLU去除对该类别有负影响的点,得到最终的热力图: $$L_{Grad-CAM}^c=ReLU(\sum\limits_
2020-05-10
SS+Grad-Cam SS+Grad-Cam
📖 区域建议生成基于Selective Search和Grad-CAM,采用由粗到细的two-stage方法来生成区域建议。 第一个stage采用VGG16模型训练一组带有图像级标签的粗分类器,通过sigmoid交叉熵损失函数进行多标签图
2020-05-10
Faster RCNN代码解析 Faster RCNN代码解析
本文转载自GiantPandaCV,感谢整理分享。 📖 Faster RCNN整体结构 Faster RCNN大概可以分成绿色描述的个部分,即: DataSet:代表数据集,典型的比如VOC和COCO。 Extrator:特征提取器
2020-05-04
1 / 2