课程简介: 视觉识别是人工智能中重要的一个版块,可应用于安防、医疗、金融、手机、交通等领域。OpenVINO™是英特尔®于2018年发布开源且免费商用的软件包,主要应用于计算机视觉,实现神经网络模型优化和推理计算加速,助力AI开发者快速进行应用程序或解决方案开发,可解决视觉模拟、自动语音识别、自然语言处理、推荐系统等多种任务。
英特尔OpenVINO工具套件课程传送门: 51OPENLAB
在实验过程中,操作系统为Linux系统
视觉识别是人工智能中重要的一个版块,可应用于安防、医疗、金融、手机、交通等领域。OpenVINO™是英特尔®于2018年发布开源且免费商用的软件包,主要应用于计算机视觉,实现神经网络模型优化和推理计算加速,助力AI开发者快速进行应用程序或解决方案开发,可解决视觉模拟、自动语音识别、自然语言处理、推荐系统等多种任务。本课程将帮助学员快速理解英特尔® OpenVINO™工具套件的基本概念以及应用场景。
1.(20分)
下列关于OpenVINO™工具套件的说法,哪个不是正确的?
A.OpenVINO™工具套件提供了一个开源版本
B.OpenVINO™工具套件提供云服务计算
C.OpenVINO™工具套件免费提供开发者下载与使用
D.OpenVINO™工具套件提供了学习资料,演示示例以及具体实例
解析:OpenVINO™工具套件并不提供云计算服务,它是免费提供开发者进行下载与使用,并且在Github上提供了开源版本。在OpenVINO™工具套件的本地文件夹中还提供了很多预训练的模型以及如何使用OpenVINO™工具套件的演示案例及其源代码。
2.(20分)
由于信息时代的快速发展,每天产生的数据与信息不计其数,所以人类寻求使用人工智能(AI)的方式,制造出智能系统来帮助人类自己做信息的处理与判断。
A.错误
B.正确
解析:针对每天产生的庞大数据,人们已经无法逐一进行处理,所以人工智能(AI)是一个很好的方式来帮助人们一些重复单调的任务。以此来减小人们的工作量,并且还能获得一个比较高的效率。
3.(20分)
在英特尔这套AI课程系统中,我们一共有几个阶段的课程?
A.2个
B.3个
C.1
解析:针对不同阶段的受众,我们为想进行计算机视觉以及Intel® OpenVINO™工具集学习的开发者设计了3个阶段的课程,分别是《100-初级课程》,《200-中级课程》以及《300-高级课程》。
4.(20分)
在构建AI产品的过程中,Intel®为我们提供了什么工具来进行支持?
A.OneVINO ™工具套件
B.OpenFino ™工具套件
C.OpenVINO™工具套件
解析:在构建AI产品的过程中,Intel®提供了OpenVINO™工具套件来支持开发者应对开发过程中的计算机视觉推理和神经网络优化难题。并且开发者可以在200课程中详细学习OpenVINO™工具集的用法。
5.(20分)
AI的应用领域十分广泛,如下是AI的应用领域的是:
A.所有选项
B.商品零售业
C.视频监控
D.公共交通
解析:AI的应用场景十分广泛,不仅包含了商品零售,公共交通,视频监控,而且在教育领域,工业领域等等其他领域都发挥着十分重要的作用。
1.(20分)
视频是由大量的图片通过连续快速放映而产生的连续性的动作。
A.错误
B.正确
解析:视频是由大量的图片通过连续快速放映而产生的连续性的动作。通过课程资料可知,不同的视频对应不同的帧率,帧率对应的是每秒钟放映的图片数量。
2.(20分)
当像素中的参数(R=255,G=0,B=0)时此像素显示红色,若像素中的参数为(R=0,G=0,B=255)时,该像素显示什么颜色:
A.绿色
B.蓝色
C.白色
解析:当像素使用RGB三通道来显示颜色时,R代表RED(红色),G代表GREEN(绿色),B代表BLUE(蓝色)并且每个通道的数值范围是[0,255]。像素所显示的颜色是由这三个通道给出的颜色做出叠加,所以当(R=0,G=0,B=255),像素显示蓝色。
3.(20分)
OpenCV作为一个常用的计算机视觉工具库,它能帮助我们做如下哪些操作
A.寻找图像边缘
B.所有选项
C.读取/写入图像
D.旋转图像
解析:OpenCV是一个常用的计算机视觉库,它不仅能够读写图像,寻找边缘,旋转图像,而且还可以做一些更高级包括视频编解码,视频识别推理等高级功能。
4.(20分)
在课程中看到的滑雪图片,该图片由一个像素构成的。
A.错误
B.正确
解析:图片是由大量的像素点构成的,像素的数量由图片的长与宽确定。
5.(20分)
当改变图片中每个像素值,使每一点的像素值更改为它的周围8个像素的的平均值,该图片会变得
A.不变
B.更清晰
C.更模糊
解析:当像素值更改为它的周围8个像素的平均值,相当于该像素与周围像素差值变得更平均,过渡得更平滑,所以说图像的边缘被平滑化,展现在图片中则是显得整个图片更模糊。
1.(20分)
设定解压缩规则的是编码解码器,而视频文件是则类似于一个容器包含了视频流,音频流以及相关信息流。
A.错误
B.正确
解析:编码解码器给视频的压缩制定编码解码规则,我们日常用到比较多的例如.MP4文件则是封装了不同编解码器所制定的视频流,音频流,或者其他信息流等等。
2.(20分)
在被压缩后的视频中,用于存储全部像素值信息的帧是:
A.B帧
B.I 帧
C.P帧
解析:在视频压缩过程中,I帧用于存储全部的像素值信息;P帧一般会存储I帧信息的一半,剩下的一半像素值信息用前一个I帧的信息来补足;B帧一般存储I帧信息的四分之一,B帧介于I帧与P帧之间,插值补足I帧与P帧之间的动作误差。
3.(20分)
一般来说,我们在互联网上观看一个1分钟的视频,此视频的文件大小为10GB。
A.错误
B.正确
解析:一般来说,为了保证网络的数据流量通畅,视频在网络上传输的版本都是经过视频压缩的,一个一分钟的视频文件大小应该在100MB以下。
4.(20分)
Intel®的集成显卡作为视频处理的硬件,我们通过什么软件工具可以访问底层视频编解码单元以及相应的加速模块?
A.FFMPEG
B.OpenCV
C.选项中任意一个
D.Gstreamer
E.Intel® Media SDK
解析:OpenCV,FFMEPEG,Gstreamer或者Intel®Media
SDK都可以帮助开发者进行视频的编解码,并且不同软件还提供不同的加速技术。他们都可以很方便地为开发者处理视频提供软硬件加速功能。
5.(20分)
为了减小视频大小,我们需要压缩视频,在视频压缩中我们需要使用冗余来替换掉视频中出现的重复性数据。视频冗余则分为:
A.不是时间冗余 OR 空间冗余
B.时间冗余
C.时间冗余 和 空间冗余
D.空间冗余
解析:根据课程可知,冗余分为两类,第一类为时间冗余,指的是在一段时间内某固定区域的像素参数不发生改变,则只存储第一帧的参数即可,链接帧的参数从第一帧进行复制,来达到减少保存的像素参数数据。第二类为空间冗余,指的在画面在变化的时候,某区域的图像发生移动,但是区域内的像素参数保持不变,则通过存储第一帧的相关区域内的参数来复制到链接帧发生移动的相关区域,达到减少保存的像素参数数据。
1.(20分)
模型优化器是一种基于 Python* 的工具,可将输入的训练模型从标准框架转换为统一的 IR 文件。
A.错误
B.正确
解析:模型优化器是一种跨平台的命令行工具,可促进训练和部署环境之间的转换,执行静态模型分析,并将深度学习模型调整为中间表示 (IR)通过推理引擎实现最佳执行。
2.(20分)
深度学习模型应用于方方面面,以下是常用的模型分类是:
A.图像分割
B.人脸识别
C.目标追踪
D.物体分类
E.所有选项
解析:深度学习模型不仅能用于除了题设中的这几类模型,深度学习模型的可扩展性非常强,也可以用于许多非视觉领域中,例如动作识别,声波识别等等。
3.(20分)
仅凭有4只脚和1一个尾巴是不足以判断是否是一只小猫。所以用来判断小猫的是必须需要多层特征结构的神经网络。
A.错误
B.正确
解析:仅有两个特征不足以判断某一图片是一只小猫的图片,在日常的认知中,需要更多的特征去准确判断一个物体的属性。对于神经网络来说层数越多则代表包含的特征越多,若是只有一层则可能包含的特征比较少,不能准确地进行判断,所以我们需要多层结构的神经网络。
4.(20分)
英特尔® OpenVINO™ 工具套件中用于模型优化以及推理加速的组件是:
A.模型优化器
B.模型优化器 & 参考实例
C.推理引擎
D.参考实例
E.模型优化器 & 推理引擎
解析:英特尔® OpenVINO™ 工具套件用于模型优化以及推理加速的组件是模型优化器和推理引擎,支持开发人员在其针对英特尔
CPU、GPU(英特尔®集成显卡)、VPU 和 FPGA 产品的应用中部署优化的预训练深度学习模型。
5.(20分)
理想情况下,当深度神经网络训练完成时,训练网络的误差将会:
A.趋近1
B.趋近100
C.趋近0
解析:深度学习中,训练的定义就是通过不断地改变神经网络的参数来使神经网络输出值与目标值之间的误差越来小。在理想情况下,当深度神经网络训练完成时,用于验证的数据正确率将会达到百分之百,换句话说,每一次推理都会是正确的,所以训练网络的误差将无限接近于0。
1.(20分)
英特尔® OpenVINO™ 工具套件支持以下操作系统:
A.CentOS*
B.全部选项
C.Windows® 10
D.macOS*
E.Ubuntu*
解析:英特尔® OpenVINO™ 工具套件可为在 Ubuntu*、CentOS*、Yocto、Project*、Windows*、Raspbian* OS 和 macOS* 上运行的应用提供计算机视觉和深度学习支持。
2.(20分)
在OpenVINO™工具套件中,主要用于推理加速神经网络模型的模块是:
A.Intel® Media SDK
B.全部选项
C.OpenCV
D.Deep learning Deployment toolkit
解析:在OpenVINO™工具套件中,主要用于推理加速神经网络模型的模块是Deep learning Deployment
toolkit(DLDT),其主要组件是模型优化器和推理引擎。
3.(20分)
在视频每帧图像处理流程中,在解码部分进行图像的缩放以及重定义大小操作。
A.正确
B.错误
解析:在视频单帧处理流程中,在解码部分是对视频文件进行解压,以此得到需要处理的原始图像,而在预处理阶段对此图像进行图像的缩放,变化大小,以及裁剪相关感兴趣的区域等等操作。
4.(20分)
Intel® Media SDK可以用于视频中图像的推理。
A.错误
B.正确
解析:ntel® Media
SDK作为英特尔®提供一系列视频图像解决方案工具套件,其中包含了视频的编解码,以及针对图像的各类操作,但是其不具有在视觉应用中的推理功能。开发者可以使用Intel®OpenVINO™工具套件中的深度学习部署工具套件,利用深度学习模型实现视觉应用中的推理功能。
5.(20分)
英特尔® OpenVINO™ 工具套件不支持传统的计算机视觉库,包括OpenCV 和 OpenVX。
A.错误
B.正确
解析:英特尔® OpenVINO™ 工具套件支持传统的计算机视觉库,包括 OpenCV 和 OpenVX。OpenCV 和 OpenVX
等优化库作为英特尔® OpenVINO™ 工具套件的一部分提供,以帮助开发和优化英特尔® 产品的计算机视觉和图像处理流程。
1.(20分)
当某一开发者想要去设计一个统计商场人流的计算机视觉应用,通过课程中提到的行人追踪示例,将此示例应用于商场中摄像头上,每当此商场摄像头出现一个相同的人,则人流量数据统计总数加一。若只有一个摄像头,那么这个摄像头置于商场的哪个位置会比较合适?
A.商场行人进出大门
B.停车场
C.卫生间
解析:这是一道实际应用题,根据题意,卫生间或者停车场的人流数据可能会造成人流的统计不足商场大门的流量准确,所以最好的位置应该是位于商场的行人进出大门。同时你也可以想一想在这个实例中,怎么做才能使得应用计算机视觉推理的方案统计得更加准确。
2.(20分)
推理引擎允许开发人员使用哪些设备用于推理?
A.所有选项全部
B.FPGA
C.GPU(英特尔®集成显卡)
D.所有选项都不是
E.VPU
F.CPU
解析:英特尔® OpenVINO™ 工具套件提供的推理引擎允许开发人员以英特尔的硬件平台产品组合为目标。这些产品包括英特尔® CPU、GPU、VPU 和 FPGA 产品。
3.(20分)
视频演示中读入的模型文件是什么格式?
A…bin 文件
B…xml 文件
C…h5 文件
D…h5 和 .xml 文件
解析:模型优化器会生成模型的中间表示 (IR) 文件,可以使用推理引擎对其进行读取、加载和推理。中间表示包括一个描述网络拓扑的 .xml
文件和一个包含权重数据的 .bin 文件。一般用XML文件作为读入模型的文件,应用程序会通过前缀寻找到相同文件目录下的.BIN文件自动读入。
4.(20分)
一个计算机视觉应用中允许使用两个或者更多个模型。
A.正确
B.错误
解析:在一个计算机视觉应用中,如果有两个或者多个不同需求的任务并行运行,则该应用中每一个模型会用于解决不同需求的任务。所以根据需求,一个应用是可以使用多个模型的。
5.(20分)
OpenVINO ™预训练模型主题包括:
A.面部检测
B.所有选项
C.车辆特征识别
D.行人检测 和 车辆特征识别
E.行人检测
解析:英特尔® OpenVINO™ 工具套件提供经过优化、公开可用的预训练模型。其中一些模型涵盖了人脸检测、人体检测和车辆特征识别等功能。
1.(20分)
英特尔® OpenVINO™ 工具套件专注于深度学习推理,而非训练。
A.错误
B.正确
解析:英特尔® OpenVINO™ 工具套件是一个全面的工具套件,支持开发人员优化预训练的深度学习模型,在一系列英特尔® 产品中执行高效的推理操作。
2.(20分)
使用Intel的CPU的推理效果一定比它的集成显卡性能好。
A.正确
B.错误
解析:由于Intel®集成显卡的快速发展,在最新一代的集成显卡已经有了一个强大多流处理器的核心单元,处理推理任务时集成显卡也能获得一个不错的效果。所以在每一个推理任务中,我们必须去测试CPU与集成显卡的实际性能,Intel®的CPU的推理性能有可能不及它的集成显卡。
3.(20分)
在推理前必须准备好一个训练好的模型,构建这个模型的框架可以是:
A.所有选项
B.MXNet
C.TensorFlow
D.Kaldi
E.Caffe
F.TensorFlow,Caffe和 Kaldi
解析:OpenVINO™工具套件专注于深度学习的推理加速,开发者在使用前必须准备一个已经训练好的模型,这些训练好的模型必须是如下的框架:Caffe,TensorFlow,MXNet,ONNX,Kaldi。目前不直接支持Pytorch,但是可以通过Pytorch转ONNX的方式来使用OpenVINO™工具套件。
4.(20分)
在AI产品落地前,必须经过本地测试来确保实际推理性能满足理论设置的推理性能要求。
A.错误
B.正确
解析:在AI产品落地前,必须经过性能测试,以及实际的设备测试,来保证AI产品满足所需求的性能。因为实际落地情况和理论性能都会存在一定差距,也许是电压问题或者传输的带宽都会影响最终产品的性能,所以建议每一个产品都需要在最后做一个落地测试。
5.(20分)
OpenVINO™不支持最新的Intel智能硬件,比如第二代神经电脑棒 (NCS2)。
A.错误
B.正确
解析:OpenVINO™会实时支持英特尔®推出的新的硬件,不论是最新的第十代处理器还是第二代神经计算棒,OpenVINO™都已经完全支持了。之后继续推出的智能硬件产品,OpenVINO™都会不断进行支持。
1.(20分)
关于推理的性能评估,intel®为开发者准备了多个工具,包括了:
A.OpenVINO™工具套件中的Benchmark App
B.所有选项
C.Dev-Cloud
D.DL Workbench
解析:intel®为开发者准备了:Benchmark
App用来直接输入模型,获取模型的FPS参数性能;Dev-Cloud是一个巨大的服务器,里面装载了最新的Intel®硬件,可以供开发者运行OpenVINO™在最新的设备上测试性能;DL Workbench是一个网页应用,可以直接通过浏览器访问一个OpenVINO™工具套件图形化的性能调优与测试平台。
2.(20分)
英特尔® OpenVINO™ 工具套件提供了一个实用程序“模型下载器”,用于从互联网下载公开可用的预训练模型。
A.错误
B.正确
解析:“模型下载器”是英特尔® OpenVINO™工具套件提供的关键实用程序之一。它为开发人员提供了一个命令行界面,可下载各种问题领域的各种公开可用的开源预训练深度神经网络 (DNN)模型。
3.(20分)
在模型训练进行之前,必须准备好送入模型的数据集,以下4个对数据集的准备操作:(A-数据清洗,B-裁剪分离目标区域,C-收集数据,D-数据标注),正确的顺序是:
A.B->C->A->D
B.A->B->C->D
C.C->A->B->D
D.D->A->B->C
解析:在准备模型时,可以通过其他软件进行训练。准备训练数据集的正确顺序先收集所有需要的数据,再对这些数据进行清洗拿到真正有用的数据,将这些数据里需要的信息进行裁剪分离,最后对这些分离的数据进行信息标注,这样的数据集作为我们训练的输入数据集。
4.(20分)
OpenVINO™工具套件提供了许多Demo和示例供开发者进行初步学习,这些示例使用的开发语言有:
A.C++
B.C++ & Python
C.所有选项
D.Python
E.Basic
解析:在OpenVINO™工具套件提供了许多Demo和示例为开发者的开发工作进行参考。在这些示例中,有基于C++和基于Python的例子。开发者在初学阶段可以使用这些例子快速上手OpenVINO™工具套件,在后期使用阶段也可以参考例子的结构写法,合理高效地使用OpenVINO™工具套件加速视觉应用的推理任务。
5.(20分)
在AI开发的过程中,合理运用已经集成好的软件工具能减小的开发工作量。例如,使用Gstreamer+OpenVINO™的组合,可以完整提供图像处理流程中的包括编解码,图像处理,以及图像推理的功能。
A.正确
B.错误
解析:Gstreamer是一个是用来构建流媒体应用的开源多媒体框架(framework),其目标是要简化音/视频应用程序的开发。OpenVINO™是一个专注处理视觉推理以及神经网络优化的工具讨教。两者在构建AI产品的流程中都可以发挥巨大的作用,可以使用两者提供的API来快速构建AI产品。
1.(10分)
Intel® DevCloud允许用户上传自己的数据集和模型到DevCloud云端进行推理。
A.错误
B.正确
解析:由视频可知,该描述是正确的。DevCloud不仅本身有许多AI示例可以运行,也允许用户上传数据进行使用。
2.(20分)
Intel® DevCloud支持以下哪些功能?
A.推理性能对比分析
B.获取现成的AI解决方案
C.全部选项
D.测试模型性能
E.运行OpenVINO推理示例
解析:由视频可知,用户登陆DevCloud上可以运行OpenVINO推理示例,可以测试模型性能,同时也可以通过图表的方式进行推理性能对比分析。对于成本预算以及时间紧张的客户来说,可以获取云端现成的AI解决方案进行部署开发。
3.(10分)
Intel® DevCloud是一个在线沙盒平台 ,可以提供Intel物理硬件供用户远程登陆使用。
A.正确
B.错误
解析:由视频可知,该描述是正确的。
4.(20分)
以下哪些推理硬件,用户可以在DevCloud中使用?
A.英特尔® 酷睿™ 处理器
B.英特尔凌动® 处理器
C.英特尔® 至强® 处理器
D.全部选项
E.英特尔® Movidius™ 视觉处理器
解析:DevCloud中包括了Intel®全系列硬件可供用户进行使用,包括了CPU:Xeon,Core i3、i5、i7,Atom,Movidius等。之后也将会不断地补充最新的Intel®硬件进入DevCloud的硬件列表中。
5.(20分)
Intel® DevCloud的使用流程是怎样的?
A.网页登陆—>链接至DevCloud服务器—>推理任务部署—>返回推理结果
B.网页登陆—>推理任务部署—>链接至DevCloud服务器—>返回推理结果
C.本地客户端登陆—>推理任务部署—>链接至DevCloud服务器—>返回推理结果
D.本地客户端登陆—>链接至DevCloud服务器—>推理任务部署—>返回推理结果
解析:正确的流程,如视频所述,用户通过网页登陆->链接至DevCloud服务器进行开发->服务器将推理任务部署到实际的硬件中进行推理->服务器最后返回推理结果至网页端。
6.(20分)
判断:用户需要付费购买DevCloud的使用权限。
A.正确
B.错误
解析:DevCloud供用户免费注册,免费使用,而且里面的硬件会不断更新。
1.(20分)
Intel®的集成显卡可以用于加速视频的编解码。
A.错误
B.正确
解析:在Intel®的集成显卡中,有对应的视频编解码加速单元,所以在处理视频的编解码时,使用集成显卡可以进行编解码加速以及能够同时处理多路的视频流。
2.(20分)
简单来说,什么是 OpenVINO™?
A.一种工具套件
B.一种编程语言
C.一家云服务提供商
D.一种操作系统
解析:Intel® OpenVINO™ 工具套件是一款全面的工具套件,支持开发人员快速开发能够模拟人类视觉的应用和解决方案。
3.(20分)
为了构建出一个成熟的AI产品,流程中包含什么步骤:
A.硬件选择
B.模型选择
C.性能评估
D.所有选项
E.完整工作流程搭建
F.模型选择、 硬件选择和 完整工作流程搭建
解析:通过课程可知,在构建AI产品过程中,以上选项都是必须的。除此以外,其实在实际生产中,还需要对每一个步骤有一个更深层次的设计与实验。最终产品的落地,肯定都是在多次实验,以及对于性能不断调优之后得出一个结果。
4.(20分)
视频的压缩目的是为了解决视频过大过多消耗资源的问题。
A.错误
B.正确
解析:视频压缩技术使视频文件大小减小,有利于视频的传输,能够节约视频文件的储存空间。
5.(20分)
关于OpenVINO™工具套件的说法,以下不正确的是:
A.在使用OpenVINO™工具套件前,必须搭建并训练好自己模型或者下载好已经训练好的模型。
B.OpenVINO™工具套件的意义在于能让开发者在使用Intel®任何硬件进行模型推理的时候,提高它的推理性能。
C.OpenVINO™工具套件针对提升的领域是模型的推理。
D.OpenVINO™工具套件能够进行模型的搭建以及模型的训练。
解析:OpenVINO™工具套件是服务模型的推理而存在的,它并不能进行模型的搭建。我们必须在使用OpenVINO™工具套件前,搭建并训练好自己模型或者下载好已经训练好的模型OpenVINO™工具套件的意义在于能让开发者在使用Intel®任何硬件进行模型推理的时候,提高它的推理性能。