深度学习学了有用吗

2020-07-28 10:27发布

2条回答
中华小当家
2楼 · 2020-08-07 10:59

深度学习以后可以从事的工作岗位有很多。

比如:人工智能算法工程师、深度学习算法工程师、计算机视觉工程师、深度学习训练工程师、图像处理算法工程师、自然语言处理算法工程师、智能制造算法工程师、强化学习工程师等等。

前景可期。


卡卡
3楼 · 2021-01-05 08:56







深度学习笔记(20)端到端学习

  1. 端到端的深度学习概念2.语音识别的端到端学习3.人脸识别的端到端学习4.机器翻译的端到端学习5.非端到端6.端到端的优缺点7.端到端的关键问题



  1. 端到端的深度学习概念

  2. 深度学习中最令人振奋的最新动态之一就是端到端深度学习的兴起

  3. 简而言之,以前有一些数据处理系统或者学习系统,它们需要多个阶段的处理端到端深度学习就是忽略所有这些不同的阶段,用单个神经网络代替它

2.语音识别的端到端学习

来看一些例子,以语音识别为例目标是输入x,一段音频,把它映射到一个输出y,就是这段音频的听写文本所以传统上,语音识别需要很多阶段的处理首先会提取一些特征,一些手工设计的音频特征比如MFCC,这种算法是用来从音频中提取一组特定的人工设计的特征在提取出一些低层次特征之后,可以应用机器学习算法在音频片段中找到音位所以音位是声音的基本单位,比如说“Cat”这个词是三个音节构成的,Cu-、Ah-和Tu-算法就把这三个音位提取出来然后将音位串在一起构成独立的词然后将词串起来构成音频片段的听写文本所以,和这种有很多阶段的流水线相比,端到端深度学习做的是训练一个巨大的神经网络,输入就是一段音频,输出直接是听写文本

事实证明,端到端深度学习的挑战之一是,可能需要大量数据才能让系统表现良好比如,只有3k小时数据去训练语音识别系统,那么传统的流水线效果真的很好但当拥有非常大的数据集时,比如10k小时数据或者100k小时数据这样端到端方法突然开始很厉害了

需要大数据集才能让端到端方法真正发出耀眼光芒如果数据量适中,那么也可以用中间件方法,可能输入还是音频然后绕过特征提取,直接尝试从神经网络输出音位


3.人脸识别的端到端学习

端到端学习也可以在其他阶段用就如人脸识别,首先是找到人脸然后放大图像的那部分,并裁剪图像,使人脸居中显示然后再喂到神经网络里,让网络去学习,估计身份总的来说就是,是弄清楚脸在哪里,再弄清楚这是谁

两步法更好原因:一是解决的两个问题,每个问题实际上要简单得多二是两个子任务的训练数据都很多

具体来说,有很多数据可以用于人脸识别训练,对于这里的任务1来说,任务就是观察一张图找出人脸所在的位置,把人脸图像框出来所以有很多数据,有很多标签数据(x,y)其中x是图片,y是表示人脸的位置,可以建立一个神经网络,可以很好地处理任务1

然后任务2,也有很多数据可用,比如说数百万张人脸照片所以输入一张裁剪得很紧凑的照片,今天业界领先的人脸识别团队有至少数亿的图像,可以用来观察两张图片,并试图判断照片里人的身份,确定是否同一个人

相比之下,如果想一步到位,这样(x,y)的数据对就少得多其中x是门禁系统拍摄的图像,y是那人的身份因为没有足够多的数据去解决这个端到端学习问题但却有足够多的数据来解决子问题1和子问题2

实际上,把这个分成两个子问题,比纯粹的端到端深度学习方法,达到更好的表现不过如果有足够多的数据来做端到端学习,也许端到端方法效果更好但在今天的实践中,并不是最好的方法


4.机器翻译的端到端学习

再来看几个例子,比如机器翻译传统上,机器翻译系统也有一个很复杂的流水线比如英语机翻得到文本,然后做文本分析基本上要从文本中提取一些特征之类的,经过很多步骤最后会将英文文本翻译成法文

因为对于机器翻译来说的确有很多(英文,法文)的数据对端到端深度学习在机器翻译领域非常好用那是因为现在可以收集x-y对的大数据集就是英文句子和对应的法语翻译


5.非端到端

比如说希望观察一个孩子手部的X光照片,并估计一个孩子的年龄这个问题的典型应用,是儿科医生用来判断一个孩子的发育是否正常处理这个例子的一个非端到端方法,就是照一张图,然后分割出每一块骨头所以就是分辨出那段骨头应该在哪里,那段骨头在哪里,那段骨头在哪里,等等

然后,知道不同骨骼的长度,可以去查表查到儿童手中骨头的平均长度来估计年龄,所以这种方法实际上很好

相比之下,如果直接从图像去判断孩子的年龄,那么需要大量的数据去直接训练但这种做法今天还是不行的,因为没有足够的数据来用端到端的方式来训练这个任务

所以在这个例子中,端到端深度学习效果很好所以端到端深度学习系统是可行的,它表现可以很好,也可以简化系统架构,不需要搭建那么多手工设计的单独组件但它也不是灵丹妙药,并不是每次都能成功


6.端到端的优缺点

假设正在搭建一个机器学习系统要决定是否使用端对端方法,了解端到端深度学习的一些优缺点这样就可以根据一些准则,判断应用程序是否有希望使用端到端方法

应用端到端学习的一些好处第一个好处是端到端学习真的是只让数据说话第二个好处是简化设计工作流程,无需花太多时间去手工设计功能和中间表示方式

这里有一些缺点,首先,它可能需要大量的数据另一个缺点是,它排除了可能有用的手工设计组件


7.端到端的关键问题

学习算法有两个主要的知识来源一个是数据,另一个是手工设计的任何东西,可能是组件,功能,或者其他所以,在构建一个新的机器学习系统时是否使用端到端深度学习的关键问题是是否有足够的数据能够直接学到从x映射到y足够复杂的函数

现在还没有正式定义过这个词“必要复杂度(complexityneeded)”但直觉上,如果想从x到y的数据学习出一个函数就是看着这样的图像识别出图像中所有骨头的位置那么也许这像是识别图中骨头这样相对简单的问题也许系统不需要那么多数据来学会处理这个任务

给出一张人物照片,也许在图中把人脸找出来不是什么难事所以也许不需要太多数据去找到人脸,或者至少可以找到足够数据去解决这个问题

相对来说,把手的X射线照片直接映射到孩子的年龄,直接去找这种函数,直觉上似乎是更为复杂的问题

最后讲一个更复杂的例子,吴恩达老师一直在花时间帮忙主攻无人驾驶技术的公司drive.ai造出一辆能自主行驶的车,这不是端到端的深度学习方法可以把车前方的雷达、激光雷达或者其他传感器的读数看成是输入图像但是为了说明起来简单,就说拍一张车前方或者周围的照片然后驾驶要安全的话,必须能检测到附近的车,也需要检测到行人,需要检测其他的东西之后就需要计划路线,需要决定如何摆方向盘引导车子的路径,还要发出合适的加速和制动指令从传感器或图像输入到检测行人和车辆,深度学习可以做得很好

但一旦知道其他车辆和行人的位置或者动向,选择一条车要走的路这通常用的不是深度学习,而是用所谓的运动规划软件完成的

如果学过机器人课程,一定知道运动规划然后决定了你的车子要走的路径之后还会有一些其他算法,控制算法可以产生精确的决策确定方向盘应该精确地转多少度,油门或刹车上应该用多少力

所以这个例子就表明如果想使用机器学习或者深度学习来学习某些单独的组件那么应用监督学习时,应该仔细选择要学习的x到y映射类型这取决于那些任务可以收集数据

相比之下,谈论纯端到端深度学习方法是很激动人心的输入图像,直接得出方向盘转角但是就目前能收集到的数据而言还有现在能够用神经网络学习的数据类型而言这实际上不是最有希望的方法这种纯粹的端到端深度学习方法

其实前景不如这样更复杂的多步方法目前能收集到的数据,还有现在训练神经网络的能力是有局限的

这就是端到端的深度学习,有时候效果拔群但也要注意应该在什么时候使用端到端深度学习


参考:

《神经网络和深度学习》视频课程


相关推荐:

深度学习笔记(19)多任务学习深度学习笔记(18)迁移学习深度学习笔记(17)误差分析(二)深度学习笔记(16)误差分析(一)深度学习笔记(15)人的表现


谢谢!


相关问题推荐

  • 回答 20

    选对培训机构比较重要,还有就是选择的时候看一下自己适合哪种风格的讲课方式,这个也很重要。因为现在5G时代来临,人工智能绝对是一个发展的大趋势,如果你自己空余时间又比较多的话,其实可以报一个辅导班,学习学习一些基本的东西,毕竟多学点总是没有坏处...

  • 回答 3

    深度学习是近几年人工智能领域的主要研究方向。深度学习的主要任务是通过构建深度卷积神经网络(Deep Neural Network,DNN)和采用大量样本数据作为输入,人们最终会得到一个具有强大分析能力和识别能力的模型,该模型包含了DNN的构成参数以应用于实际工作。...

  • 回答 3

    AI深度学习课程是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术,主要应用于图像识别、语音识别、自然语言处理等领域。学完可以从事深度学习工程师、机器学习工程师、人工智能工程师、高级算法工程师、高级算法工...

  • 回答 16

    算法,数据相关的适合做人工智能

  • 回答 28

    人工智能取代的行业,一定有如下几个特征:1、大量重复型。2、逻辑性比较强。3、数据库依赖型。像司机,咨询,教育,医生,会计,律师助理,工程师,码农等,都是容易被取代的行业。当然,这都是强人工智能以后会发生的事,现在还是弱人工智能的时代,想进入...

  • 回答 9

    如果你是自己学着玩,提升自己的话,高中毕业都可以。如果是冲着AI算法岗或者科研一席之地,至少211硕士。具体可以亲身体验一下今年算法岗秋招。

  • 回答 9

    可以,未来的人工智能发展深度学习必然是现在大型机器生产科研必备的,证书的话某个培训好像有这个中科院的证书,具体你去百度吧

  • 回答 8

    我觉得就是人工智能的课程,现在家具都是智能家居了。这一块发展一定很好

  • 回答 3

    对于sgd算法而言,batch size太大太小都不好,太小的话训练不稳定,计算效率低;太大的话收敛速度慢,需要仔细调节一下。以2的倍数调节,例如32,64,128等

  • 回答 1

    在terminal中输入$wolf@wolf:~/Downloads/gitclonehttps://github.com/Tencent/ncnn cd切换到NCNN目录***这步很重要,这时候需要修改ncnn的root目录下的CMakeLists.txt文件,需要将倒数几行的add_subdirectory(examples),取消注释,这样就是默认编译example...

  • 回答 5

    人工智能的话其实到现在来说已经慢慢趋于成熟,学的话首先是一线城市,学出来好就业,还有就是薪资也高

  • 回答 3

    画个train and test error VS 训练数据量(training set size) 的learningcurve应该会更加直观了。可以找个简单的数据集,比如说handwritten digits或者什么的,分别用神经网络和决策树或者knn做出这个learningcurve。你会看到如果用一个决策树去解决这个问题...

  • 回答 2

    共生矩阵用两个位置的象素的联合概率密度来定义,它不仅反映亮度的分布特性,也反映具有同样亮度或接近亮度的象素之间的位置分布特性,是有关图象亮度变化的二阶统计特征。它是定义一组纹理特征的基础。     一幅图象的灰度共生矩阵能反映出图象灰度关于...

没有解决我的问题,去提问