NVIDIA 大讲堂 | 什么是卷积神经网络?
深度学习网络中的一种是卷积神经网络,它专门用于辨认图像,对图像进行归类,还能识别图像里的物体。
什么是卷积神经网络?
人工神经网络是模拟人脑神经元运作的软硬件系统。卷积神经网络常包含多个全连接层或池化层。这些层会运用多层感知器的变体,该变体主要用于对视觉输入进行分类。
人类刚出生时开元ky888棋牌官网版,对猫和鸟的外形没有概念。年纪渐长,我们逐渐掌握了某些轮廓和色调分别属于哪些生物,这些生物彼此关联形成一种类别。掌握了爪子和嘴的形态,我们就能更准确地分辨猫和鸟。
神经网络的作用方式大体相同。借助分析带有标记的图像数据集,机器可以掌握分辨构成要素,也就是识别图像里事物特性的方法。
CNN 是一种广受青睐的深度学习算法类别。卷积是将过滤器作用于输入数据的简便操作,能够产生以数值体现的响应。反复对图像使用同一过滤器,可以形成称作特征图的响应图像。该图像展现了识别到的特征所在位置及其显著程度。
卷积是一种线性变换,需要把一组系数和输入相乘,来得出一个称作滤波器的二维系数矩阵。若调整滤波器用以识别输入中的某种特定模式,那么在整个输入画面上反复应用这个滤波器,就能找出图像中任何位置的这个模式。

一种滤波器负责识别特定轮廓,另有一种滤波器负责识别竖直线,还有一种滤波器负责识别横线。其余滤波器能够识别色彩、轮廓边界以及亮度程度。将多个滤波器的分析结果组合起来,就能够形成与训练样本里已知图形相吻合的复杂形态。
卷积神经网络一般包含三个部分,分别是开始接收数据的单元,最终产生结果的单元,以及由若干个卷积单元构成的中间部分,该中间部分还融合了用于压缩信息的单元,用于整合特征的单元开yun体育官网入口登录app,以及用于调整数据分布的单元。

第一层主要用来获取轮廓线、色彩信息、斜率走向以及基础几何形态等要素。增加新的层级之后,该模型能够进一步构建复杂特征,这些特征会逐步形成一个大型棕褐色图像区域,最初识别出的是交通工具,接着是轿车,最后是别克品牌。
池化层能够逐步减小特征的空间维度,以此提升运算效能。该层会独立对每个特征图执行操作。最大池化是池化层中普遍采用的技术开元ky888棋牌官方版,它通过获取数组的最大元素,从而降低计算中必须处理的数值总量。卷积层可以叠放使用,用以将输入数据分解成其核心构成部分。
标准化层级会对数据实施归一化操作,旨在提升神经网络的运作效能与运行可靠性。该层级通过把所有输入转化为平均值等于零且变异数等于一的形式,让每一层的输入数据变得更为容易控制。
全连接层用来连接一个层级里所有神经元,与另一个层级里每一个神经元建立联系。

为什么选择卷积神经网络?
神经网络有三种基本类型:
卷积神经网络已成为众多尖端深度学习技术,比如人脸识别、手写辨识和文字数字化,等领域中计算机视觉应用的首选架构。不仅如此,它还能在推荐系统领域发挥作用。2012年,CNN技术实现了重大突破,多伦多大学一名研究生Alex Krizhevsky运用该模型,将分类错误率显著削减,从26%降至15%,并在当年的ImageNet竞赛中取得优异成绩,这一成果在当时引起了广泛关注。
实践证明,针对图像处理的应用场景,卷积神经网络模型能取得优异成果和极高运算效能。尽管卷积神经网络并非该领域适用的唯一深度学习架构,不过它已成为业内普遍的选型,并有望成为后续技术革新的核心方向。
关键用例
卷积神经网络是机器用来分析图像的工具。它广泛应用于自动驾驶汽车、石油勘探和聚变能研究等领域能够充当视觉系统。在医学影像处理中,这种技术有助于迅速识别病症从而拯救生命。
依靠卷积神经网络和循环神经网络,众多人工智能设备获得了类似人类视觉的感知功能。得益于深度学习技术数十年的演进,以及图形处理器在处理庞大数据方面的显著性能提升,绝大多数人工智能应用得以实现。
卷积神经网络的重要意义
数据科学团队
图像识别用途广泛,是众多数据科学团队不可或缺的关键技术。卷积神经网络是一种成熟的技术规范,能够为数据科学团队设定能力参照,帮助他们学习并熟练运用这些技术,以应对现在和将来的图像分析任务。
数据工程团队
熟悉深度学习模型训练流程的技术人员能够提早达成机构目标。资料库遵循既定规范,而且从业者可借助众多开源数据资源掌握相关知识。这种方式有效降低了神经网络技术实际部署的难度。
借助 GPU 加速卷积神经网络
顶尖的神经网络或许有数百万甚至十亿以上的参数需要借助反向传播来修正。不仅如此,它们还依赖海量的训练信息才能达成较高的精确度,这要求成千上万乃至数百万的输入实例必须同步完成正向与反向的运算。鉴于神经网络是由众多相同的计算单元组合而成,其内在地展现出极强的并行处理能力。这种并行处理方式很适合 GPU,所以,如果只用 CPU 来训练,那么计算速度会慢很多,性能提升会非常明显。
借助深度学习平台,科研人员可以便捷地构建并研究卷积神经网络 (CNN) 以及各类深度神经网络 (DNN),并且能够满足实验验证与实际应用对快速性的要求。NVIDIA 的深度学习软件开发工具包能够显著提升 Caffe、CNTK、TensorFlow、Theano 以及 Torch 这些主流深度学习架构的执行效率,同时也能加快许多其他机器学习软件的运算表现。
深度学习平台在图形处理器上的执行效率更高,并且能够在同一台机器里的多个图形处理器之间进行并行处理。为了使平台能与图形处理器协同工作,用以执行卷积神经网络的训练和推断任务,英伟达公司单独推出了 cuDNN 和 TensorRT 这两个工具。cuDNN 以及 TensorRT 能显著提升卷积层级、池化层级、标准化层级和激活层级等常规操作的执行效率。
NVIDIA 为了迅速推进视觉模型的开发与部署,向视觉人工智能领域的创作者推出了 DeepStream SDK,并且为计算机视觉的从业者准备了 TAO 工具集,借助这个工具集可以构建出精准且高效的智能模型。