深度学习图像识别需要哪些算法?

2020-06-09 20:42发布

1条回答
霸气的名字 - 喜欢晴天
2楼 · 2020-09-09 20:53

图像识别算法

基础知识掌握情况决定研究的高度,我们刚开始接触深度学习时,一般都是看到别人的概括,这个方法很好能让我们快速上手,但是也有一个很大的缺点, 知识理解的不透彻,导致我们对算法优化时一头雾水。我也是抱着知识总结的思想开始自己的深度学习知识精髓的探索,也希望能从中帮助到更多人。文章中间存在表述不清的地方希望各位研友(研究深度学习的朋友)提出,我会努力完善自己的文章。

进入主题,faster R-cnn 简单易懂的思虑整理:

模块介绍:

1、最重要的模块——RPN(区域建议网络)

  该网络改善了R-cnn 、Faste R-cnn的选取候选框带来的时间问题。R-CNN和检测网络共享全图的卷积特征,减少了区域建议的时间。首先遍历整个特征图上的像素点,然后以每个像素点为中心产生9个anchor,这9个anchor是一个超级参数,是我们自己固定的,一般设定为三个不同的比例和三个不同大小的参数。每个像素点得到的框我们对其根据特征对他们进行分类,主要是采用二分类,判断是前景还是背景,我们取消背景框,现在剩下的全部是包含检测物体特征的选框。下面我们将对剩下的选框再次筛选:

  现在开始区分和训练过程:

训练时我们有一个目标的ground truth,我们根据这个框可以对和我们的现存的anchor进行筛选。首先删除框本身重叠度高的,达到稀疏效果。另外有一个IOU参数,代表anchor-box与ground-truth-box之间的重叠度。当IOu大于我们设定的超级参数(一般是0.7)时会保留下来,会保证我们选取准确的框。另外还有一个小一个IOU的(一般是0.3)也会留下来。这样为了保证分类训练的样本输入的局部特征,能够保证我们能够检测是能够识别残失部分图片的信息。

接下来会有两个分支。

1、采用softmax进行分类,求出每个框的得分和类别。然后求回归,训练网络的卷积和全连接层的权重。

2、对选框进行移动到ground-true box,学习选框的回归参数,对选框进行微调。我们得到的训练参数,可以根据输入的特征(中心点长宽高对应的卷积特征)和学习到的权重矩阵,对长宽高进行微调。

检测的时候我们没有真实的框,我们在对候选框进行选择是时候。寻找一个识别度最高的框,然后根绝微调参数进行校准,达到很好的效果。

线性回归就是给定输入的特征向量X,学习一组参数W,使得经过线性回归后的值跟真实值Y(Ground Truth)非常接近。即。那么Bounding-box中我们的输入以及输出分别是什么呢?

输入:

这个是什么?输入就是这四个数值吗?其实真正的输入是这个窗口对应的CNN特征,也就是R-CNN中的Pool5feature(特征向量)。(注:训练阶段输入还包括 Ground Truth,也就是下边提到的)

输出:

需要进行的平移变换和尺度缩放,或者说是。我们的最终输出不应该是Ground Truth吗?是的,但是有了这四个变换我们就可以直接得到Ground Truth,这里还有个问题,根据上面4个公式我们可以知道,P经过,得到的并不是真实值G,而是预测值


相关问题推荐

  • 学it真的会秃头吗?2020-03-24 19:58
    回答 153
    已采纳

    这个问题提的有意思,哈哈。确实干这行的很多人都问这个问题。之前在网上传出来过一个段子,说是一个公司招聘程序员的标准是看发量的。哈哈,这都是误传,因为干这个的人在忙的时候会经常加班,熬夜不是容易脱发吗,所以就有很多人觉得做程序员的都会早秃。其...

  • 回答 17

    软考通过了,就具有相应级别的职称了,考过高级你就可以大方地称自己是高级工程师。但具有职称,不等于用人单位就会聘任你,有的单位直接聘用,但有的单位对考试取得职称的人还要评审才聘用,这种评审应该理解成是聘用的评审并不是职称的评审。...

  • CAD和C4D是一样的吗?2020-10-11 16:13
    回答 29

    cad是做平面和模型用的设计软件,而c4d大部分是做4d影视特效的。

  • 回答 40

    肯定会影响的,颜色分辨不清楚,跟大家看到的色彩是不一样的,尤其是一些渐变色,组合色。如果患有色弱的话,建议不要学习设计了,不过也不要气馁,可以选择编程类科目,Java或者web、软测都可以。...

  • 回答 27

    当你特别焦虑或者迷茫的时候,最好审视自己给自己定一个目标!不要迷茫,制定一个目标,最好分长短期。比如说你这个月要学会PPT,做到公司里最会做ppt的人;你这个月要拿下多少客户,赚多少钱;今年一定要考下教师证、会计证等等...这个根据自己的实际情况和...

  • 回答 24

      现如今在国内,现代项目管理知识在深入广泛的推广,越来越多的人士开始参加PMP考试。或许会有考生,在参加考试之前,往往会咨询一个问题,那就是PMP通过率高吗?该考试难度到底怎么样?等相关问题。其实针对该问题的回答,对于广大考生来说,则应当要从多个...

  • 回答 20

    1:制定计划。按照计划坚决执行2:抵住诱惑。全靠自己的意志力了

  • 工作一年该不该裸辞2020-03-06 16:21
    回答 17

    其实不管什么情况下最好都不要裸辞,即使要裸辞也与工作年限无关, 主要还是看你掌握的技术和你的存款。如果你对自己的技术有自信,能很快找到工作而且就算一段时间不工作也不影响生活的话也是没什么问题的。...

  • 回答 8

    同事之间或是上下级之间比较忌讳的话题大致表现为:1.个人年龄;2.个人私生活;3.与某人的交情;4.个人收入;5.个人对领导的想法与看法;6.个人对公司的想法与看法;7.个人有想离职的想法与不同同事说等。...

  • 回答 5

    不是jQuery。不是YUI。不是(等)框架可能很有用,但是它们经常隐藏一些关于JavaScript和DOM实际工作方式的丑陋细节。如果您的目标是能够说我知道JavaScript,那么在框架上投入大量时间是相反的。以下是一些JavaScript语言功能,您应该了解这些功能在做什么并...

  • 回答 8
    已采纳

    大数据是一种发展方向,而Java、Python则是编程语言,三者并能直接进行对比。虽然Java、Python是编程语言,大数据是一种技术体系的总称,是发展方向,不过在未来发展和应用上,三者是有关系的。首先,Java是学习大数据的基础,在这个层面上来看,你要选大数据...

没有解决我的问题,去提问