文档简介:
行业应用与项目案例
人工智能在中国的发展和落地概况
根据艾瑞的分析报告,人工智能在未来十年迎来落地应用的黄金期,会全面赋能实体经济,行业的经济规模年增长率达40%+。在过去中国经济高速发展的四十年,人们形成了统一的认知:对于个人发展,选择大于能力。一个人选择跳上一辆高速行驶的火车,比个人奔跑快要重要。人工智能在各行业落地相关的产业就是未来十年的高速列车,所以恭喜学习本教程的诸位读者。在可预见的未来,大家会成为各行业应用人工智能技术的弄潮儿。

图1:艾瑞关于中国AI应用规模的预估
人工智能对国家产业转型的重要性不言而语,一些美国政客已经明确提出要限制中国学者赴美进行人工智能领域的交流,以免中国智能实现工业和经济模式的升级转型。但这种趋势是不可避免的,中华人民共和国国务院已经制定了人工智能应用的发展规划,如下图所示。

图2:国务院关于AI应用发展的规划
国务院将人工智能的应用分为了三个阶段:
- 第一步,到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋斗目标。
- 第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。
- 第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。
对应的产业规模分别达到1万亿/年,5万亿/年和10万亿/年。这个数字在业内人士看,近期比较符合实际情况,远期还是相对保守。
由于2020年疫情肆虐,经济下行的压力较大。国家也提出了“新基建”的经济刺激计划。新型基础设施建设(简称:新基建),主要包括5G基站建设、特高压、城际高速铁路和城市轨道交通、新能源汽车充电桩、大数据中心、人工智能、工业互联网七大领域,涉及诸多产业链,是以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系。其中,人工智能是“新基建”的核心。

图3:人工智能是国家“新基建”核心
无论是咨询报告还是政府规划,都为人工智能的产业应用描述出无比壮阔的场景。那么,人工智能真的在各行业有这么多应用场景吗?
传统行业有AI应用空间吗
有来自传统行业的读者,即使看到了人工智能的市场发展、国家的政策支持、大量典型的应用场景,依然会心存疑虑:
“我知道很多新兴行业有不少人工智能的应用,但我所在的是非常传统的行业,我们发展了几十年了,目前运营很好,看不到需要人工智能的地方”。
相信这种疑虑也是普遍现象,对于非常传统的行业,能接受到人工智能的赋能吗?下面我们就以能源行业中的一家电力企业为例,向大家展示能源这样的传统行业,可以怎样挖掘和设计人工智能的应用场景。
典型的电力企业可以分为电网业务和支持保障业务,其中电网业务是核心业务,按照业务流程分为电网建设、购电、运行检修、售电和客户服务。在此之外,为了企业正常运营还有资源保障和辅助保障一系列的支撑型业务。

图5:典型电力企业的业务格局图
即使这样一家传统企业,在企业经营、生产管理和客户服务等多个方向,可以落地人工智能的全方位应用。
- 在企业经营与规划方面:集中在规划电网工程,线路和站点应该如何排布,每个地区的售电量和负载预测等。
- 在企业生产管理方面:集中在现场人员的身份和行为管理,或者使用机器代替员工进行各种仪表和情况问题的巡检。
- 在客户服务方面:根据精准的用户画像进行产品推荐,营业厅、呼叫中心和微信公众号的自动客服。

图6:在企业经营、生产管理和客户服务全方位的AI应用
通过这个案例,大家可以看到,无论行业是多么传统,在业务中间均有大量可以应用人工智能技术的空间。所以,无论身在什么行业,都让我们一起拥抱人工智能吧!
项目案例:飞桨助力国网山东进行输电通道可视化巡检
在电力企业的案例中可见,即使再传统的企业也可以大量应用人工智能。如果要做到这一点,就需要飞桨的帮助。下面展示电力企业基于飞桨实现的对电网设备进行无人巡检的方案。
由于建筑施工、人为或非人为的破坏,电网需要定期进行检测维修。之前这项工作由电网员工进行,不仅耗费人力,有些关键设施的检测还需要员工冒风险作业。为了解决这个问题,国家电网山东分公司为需要检测的电网安装了监控摄像头,并期望通过人工智能技术来处理拍摄到的图片,系统自动检测有风险的电网设施。
如下图所示,建筑施工导致的通道环境问题如吊车和水泥车的检测;本体检测包括绝缘子缺陷/导地线缺陷/线夹缺陷/细小工具/附属设施/鸟巢识别等。

图7:对电网的通道环境检测和本体检测
首先,我们分析下任务的情况:
- 检测设备受限:无源无线。 监测装置(摄像头)安装在杆塔上,环境较差。一方面,现有的数据采集设备算力低下,且数量巨大,无法更换芯片(电力公司在历史上一次性的大采购)。另一方面,解决这个任务的识别精度要求高,且需提升识别速度。
- 检测目标多变:多目标多尺度。 需要检测吊车、塔吊、挖掘机等施工器械,导线异物以及烟火检测。任务属于多种目标和多种尺度的检测,这对算法提出了挑战。
根据上述分析,设计的建模方案如下:
-
算法选型:在项目面临算力小、功耗低的情况下,采用One-Stage经典优秀方案YOLOv3,在PaddleDetection、PaddleHub和Paddle Models中均有现成的模型。
-
模型压缩:因为运行模型的硬件条件较差,所以模型部署之前需要进行压缩。使用PaddleSlim对模型做出压缩,采用三种压缩策略:
(a) 裁剪模型,减少低效的网络结构)以提升模型运行速度。
(b) 蒸馏模型,使用高精但耗时的大模型训练小模型,以达到在不增加计算量情况下提升效果。
© 量化模型,模型计算量纲从32bit降低到8bit,在保持效果不变的情况下降低模型大小。
使用PaddleSlim不同的策略对模型进行压缩后,模型大小和准确率如下表所示。

-
端侧部署:使用Paddle Lite实现端侧模型部署,Paddle Lite支持众多的端侧设备,包括各种摄像头。
以上,即展示了一个传统的电力企业怎样分析自己业务中的AI应用场景,然后如何选择飞桨工具支持全流程的项目研发的过程。在本节的作业中,会请大家选择自己熟悉的行业进行产业实践的探讨,一起将人工智能的应用推向高潮。
往届优秀学员作品展示
最具创意奖:海上战斗力实时分析
- 项目背景
一提到战斗力,就很容易让人想到的是七龙珠中左耳上套着像耳罩能把人的战斗力数值化的机器。如何通过计算机视觉分析作战能力呢?接下来带来一个能把海上的作战能力进行数值化分析的小项目。
- 项目内容
通过Paddle Detection对六种战舰的图片进行迁移学习,并在服务器、移动端部署应用。
- 实现方案过程
分别选用yolov3_darknet_voc_diouloss、ssd_mobilenet_v1_voc、yolov3_mobilenet_v3三种模型网络进行迁移学习训练,并导出训练模型便于后续部署。首先使用Paddle Lite在移动端部署检测,然后使用Paddle Serving在服务器端部署检测,输出效果截图。
- 实现结果

- 项目点评
该项目新颖,趣味性比较强。并且运用三种模型进行训练部署,精度和准确度都较高,同时还在视频流中进行检测。对工业化深度学习的部署理解较为到位。
- 项目链接 https://aistudio.baidu.com/aistudio/projectdetail/543314
最具深度技术奖:垃圾分类模型部署到安卓手机
- 项目背景
垃圾分类已在全国范围内逐渐推广,使用深度学习神经网络对垃圾进行识别和分类,将节省大部分人力成本,因此本项目以此为切入点,探讨垃圾分类项目的部署可能。
- 项目内容
通过Paddle Hub迁移学习一个目标检测模型,使用Paddle Lite把模型部署在Android手机上,完成垃圾分类。
- 实现方案过程
首先将原模型的MobileNet_v2替换为resnet_v2_50_imagenet进行迁移学习,并保存训练好的模型。接着使用Paddle Lite提供的model_optimize_tool对模型进行优化,同时转化成Paddle Lite支持的文件格式,在Android手机上部署。最后,对之前的模型进行裁剪,分析裁剪前后的精度和计算能力的差别。
- 实现结果

- 项目点评
该项目使用的操作方法多且复杂,最后仍然能够做出完成度很高的作品。使用Paddle Detection进行迁移学习,然后使用Paddle Slim进行模型裁剪,最后使用Paddle Lite进行部署,完成了工业部署的全流程。且在项目中更换不同网络比较精度,学习价值较高。
- 项目链接 https://aistudio.baidu.com/aistudio/projectdetail/529339
最具潜力奖:基于商业街入口摄像头的人流量分析
- 项目背景
随着疫情的逐渐好转,各大商业广场,步行街等,已开始逐步开放。以武汉光谷步行街为例,从五月初开始就有大约70%以上的商店开始营业,但在6月前他们的经营状况并不太乐观,非节假日几乎没有什么客人到步行街消费。如果能估算出每天不同时间点和节假日与非节假日的客流量,将对商家的开店时间,商业街的促进消费营销策略提供很有意义的参考。
-
项目内容 商业街的出入口人流量巨大,行人之间互相存在严重的遮挡现象,而商业街的监控摄像头大多为俯视角拍摄,即使行人之间存在遮挡,摄像头也能捕捉到大部分游客的头肩特征。因此基于这种考虑,通过检测行人的头肩特征来统计行人,能大幅提高召回率。通过使用Paddle Detecion训练人体头肩检测模型,并在视频流中检测输出不同时间视频帧中出现行人的数量。
-
实现方案过程 首先使用INRIA的行人图片,用lableimg对人的头肩进行标注,然后在paddleX下对标注好的数据集进行切分,最后使用paddle detection训练人体头肩检测模型(YOLO V3)并保存,将保存好的模型运用到给定的商场人流视频中,得到反馈人数的输出。
-
实现结果

- 项目点评
使用paddledetction进行迁移学习,对人体头部和肩膀进行检测,来判断人流。可视化效果好。并且用在视频流的检测上,可以看到视频中每一帧的人流变化,实际意义较高。同时,根据此模型加上DeepSORT算法可以对行人的出入情况进行分析,较为准确的分析出具体出入人数,具有较大潜力。
- 项目链接 https://aistudio.baidu.com/aistudio/projectdetail/566066
最用心奖:咖啡豆筛选
- 项目背景
在烘焙业中,普遍采用色选机对咖啡生豆进行筛选,色选机通过机械结构将咖啡分成一粒一粒的,再通过CV技术将咖啡豆进行分类。如何实现这一操作呢?此项目通过深度学习目标检测,完成对虫洞、贝壳豆、瑕疵豆、碎片等的筛选。
- 项目内容
使用PaddleX完成对咖啡豆的质量分类。
-
实现方案过程 咖啡豆分类问题为典型的细粒度图像分类问题(FGVC)。期初采用的样本集只有500-600张图片,且分为6个类别,导致每个类别中样本数过少,在训练过程中,出现了ResNet50分类模型将所有样本分入同一类的情况。后来增加样本数至1400多个,并将分类数缩减为3个,在训练过程中采用随机图像增强、随机裁剪等策略,并调小ResNet50初始学习率至0.001,经30epoches的训练,模型收敛并在验证集上取得0.95的分类精度,在测试集上取得了0.9的分类精度。三个分类的精确率为[1.0, 0.74, 0.94],召回率为[0.98, 0.89, 0.85]。
-
实现结果

- 项目点评
该项目使用PaddleX进行目标检测的迁移学习,在数据集的处理上不仅使用了PaddleX自带的一些图像增广方法,同时使用了一些常用的计算机视觉里面图像处理的方法,前期工作十分到位,非常用心。
- 项目链接 https://aistudio.baidu.com/aistudio/projectdetail/564541