人工智能(AI) - 一场游戏还是致胜未来的专业工具?

这也是当下的一个热门话题。旁观者往往能给出正确答案。原因是:对于一项技术必须达到或带来何种成果才能被认可与最终实现应用,每个用户都有不同的期望。然而,市面上都有生产和高效使用AI技术所需的硬件。许多机器视觉硬件制造商已经意识到这一点。因此,不同性能级别的AI平台范围正在稳步增长。但是此项新技术仍有一些需要在初期解决的问题。仅提供硬件已完全不够——我们需要转换思维方式!

AI技术缺少了什么?

而且,人工智能或机器学习(ML)的工作方式与基于规则的图像处理截然不同,因此视觉任务的方法和处理方式也不同。AI处理结果的质量也不再是人工开发的程序代码产物,而是由是否具有合适图像数据的学习过程来决定。这听起来很简单,但是只有通过足够的专业知识和经验才能实现预期的目标。缺少处理正确数据的专业经验,往往会导致错误发生,而又会导致机器学习方法的错误应用。测试表明,在些某些情况下,由于使用了有太多不重要内容、曝光不良、模糊不清甚至标签错误的图像,而导致不同用户在同一任务中实现了非常不同的人工神经网络(ANN)训练质量。

使用机器学习方法工作的关键能力不再与基于规则的图像处理相同,因此这些能力必须专门建立。有时间和资源来工作、测试和试用机器学习的专家正在获得这种经验,并了解其中的陷阱。这可能是目前更多的新型初创公司正在使用机器学习的原因。这些公司过去没有经验,也不受现有流程制约,这样一来,他们使用机器学习时,有时会进行探索性的有趣尝试,去冒险执行那些经典的图像处理至今仍没有解决方案的任务。但是,只要行业内大公司没有向客户全面介绍此新技术,并提供使用该技术的充分理由,就会导致知识缺乏与不信任(客户方面也是如此)。要让这些业内大公司走出舒适圈,则必须做出改变。AI技术面临的是已建立的系统,近年来人们已经创建了适合应用该技术的环境条件。与AI技术相关的知识、文档、培训、硬件、软件、开发环境、客户接受度和需求都需要相当长的时间才能完善。另一方面,人工智能技术仍显得非常原始和简单。掌握AI技术的专家在赢得钦佩与认可的同时也不可避免地面临质疑与不理解。

这项技术未来的另一重要方面是新的目标群体。Dr.-Ing.行业杂志inVISION的主编、现场专家Peter Ebert说道:“未来的机器视觉社区不仅由传统的图像处理专家组成,还会吸引越来越多的物联网行业专家加入。” 新用户群体不可避免地会产生不同的使用案例,并且他们对现有技术的使用会提出不同的要求。传统的编程SDK并不能始终满足需求。我们必须打破成规!

软件先行

我们并不缺少合适的硬件!高效工作的AI加速器让机器学习的应用尤其适用于小型、低功耗嵌入式视觉系统或全集成的推理相机平台。个别生产商已经推出这种加速器了。但这并不能解决行业内这项新技术应在初期解决的问题。AI技术必须经过测试、验证、重新训练并最终整合到高效的工作流程中,即应用中。但是哪些公司会这样做?而且还有能力这样做?所有这些操作实际上都是相同的重复任务。但这需要超越原型开发的其他能力。而且还需要能为特定平台的工具进行编程的系统程序员。

对于IDS NXT平台,IDS采用了完全不同的解决方法,并且信心十足:凭借合适、高效协作的工具,每个用户群都可以充分开发AI视觉平台的潜力,而无需花费大量的时间和金钱来建立新的核心能力。这些核心能力实际上并非操作专属的AI应用程序所必需的能力。这意味着什么呢?训练人工神经网络和为您专属的应用程序进行编程的专业知识,可以打包到许多简单AI工作流的工具中。如此一来,每个用户无需建立自己的专家团队,即可实现自己的个人要求。这款软件让每个用户都能够使用适合他们各自任务与工作方法的工具。

图像处理应用程序是一种框架,将多个特定的单独任务纳入应用程序相关的序列,以便高效、无误地执行这些任务。传统上,这项任务由开发人员在适合于该平台的程序代码中进行编程,如C++。对于即将面市的新AI平台来说,情况并无不同。借助现有的AI加速器,软件开发工具包(SDK)为各自平台的硬件相关编程提供了必需的软件接口。大多数情况下,这很大程度上为应用程序开发者专属的流程解决方案提供了自由可编程平台。对于了解编程的开发者而言,只有硬件性能和SDK才会限制创造力。对于想用深海AI加速器的形式设计他们专属图像处理应用的开发者来说,借助有许多C++源代码实例的相应SDK,IDS NXT推理相机提供了一个开放的平台。

应用程序向导

然而,大部分图像处理应用程序的工作流程相对简单。捕捉图像 → 分析图像或提取特征(图像处理) → 做出处理决定 → 启动操作。此过程可以是对产品的简单识别和分类,随后通过各种接口为机器控制或分拣系统发出信号或传输信息。这些基本功能只在一些细节上有所不同,因此不必每次进行重新编程。然而,作为项目的切入点而选择的深度学习使用案例,例如“分类”或“物体检测”,通常已经过于抽象,无法推导出数据采集和Vision App配置的进一步必要操作步骤。

因此,IDS正致力于通过IDS NXT推理相机,让人工智能便于大众理解并且易于使用。任何用户群体都可以创建应用程序,无论是程序员、图像处理专业人员,还是机器操作员和熟练工。为此,基于云的人工神经网络(ANN)培训软件IDS lighthouse将在下一次更新中对功能进行扩展,以包括一个操作向导。该向导更能针对用户的实际问题,给出适当的操作指导以支持该用户。此向导轻松地扩展了目标群体的活动半径,并且涵盖机器视觉应用的所有个性化任务。从“您想做什么?”开始,IDS lighthouse为一系列面向应用程序的问题提供了解决方案,如“计数对象”、“检查有无”或“检查检测点”。通过合适的深度学习使用案例,辅助系统在后台选择应用程序基础,并向用户建议进一步的操作,以收集必要的信息。此外,该辅助系统还提供有用的提示、视频或说明,为用户提供了必要的背景知识。这样的“引导式应用程序创建”与传统的应用程序开发相比,更像是一种教程。最后,用户将得到可供下载的全定制视觉应用程序,只需在IDS NXT相机上激活并启动即可。

以“拼图”代替编程

如果您想要创建更为复杂的流程,不一定需要使用C++或其他基于文本的编程语言。如果函数库被封装成视觉功能块,并添加了可视化编辑器,那么该过程就可以像拼图的碎片一样组合起来,而不必担心单个编程语言的确切命令。为此目的,Google专门创建了Blockly项目。IDS相机使用Blockly并调整其自身的功能,以便能够以任意复杂的序列,将相机的推理任务合并到构建工具集中。

通过Blockly,具有几个人工神经网络的多阶段检测也可以非常容易地集成到一个程序序列中。
通过Blockly,具有几个人工神经网络的多阶段检测也可以非常容易地集成到一个程序序列中。

借助Blockly编辑器直观的用户界面,即使是初学者和外行人也能很快取得成功。与应用程序向导相比,使用此模块化系统进行可视化编程的优势在于可以创建您专属的序列。由此,变量、参数和AI结果可以通过逻辑链路与数学计算、条件if/else语句或loop语句的重复操作进行轻松链接。通过两阶段目标检测和多个神经网络,该系统还可以实现更复杂的工作流。例如,对象识别器提供不同部件的基本预分类,随后由第二个分类器进行详细的缺陷分析,以便进行更具体的部件分类。否则,只有使用VAC (Vision App Creator)和C++编程知识才能实现此类流程。

拼图类应用程序的另一个优势在于其使用的高度灵活性。与Python相似,由于无需复杂的交叉编译,因此使用Blockly进行编程的Vision App支持直接执行“代码”。在IDS lighthouse中创建的应用程序,在相机中进行初步测试后,可以轻松地进行进一步交互式编程——直接在相机中编程!您还可以直接在相机中设计Vision App。这使得此视觉应用编辑器成为从测试和试用阶段到操作使用的理想工具。

从自动应用程序配置器,到具有直观视觉界面的视觉应用构建工具集,再到使用经典SDK的全免费编程,IDS NXT为具有不同专业知识水平的用户提供了适合的工具。这在使用人工智能调试和设置个人图像处理应用程序时节省了时间和成本。

人工智能结果的可解释性

尽管看到AI具有众所周知的优势,并且使用了高精确度的ANN,但在发生故障时,做出诊断往往比较困难。问题的另一面是,缺乏对AI工作方式的了解或无法解释的结果会抑制算法的传播。通常情况下,ANN经常被错误地认为是一个黑盒,会做出不可理解的决策。“虽然深度学习模型无疑是复杂的,但它们并非黑盒。事实上,称它们为玻璃盒会更为准确,因为我们可以看清楚盒子内部,看到每个组件的工作状态。”[摘自“机器学习中的黑盒隐喻”]。神经网络的推理决策不是基于经典逻辑规则,人类可能不容易理解其人工神经元的复杂交互作用。但它们仍是数学系统的结果,因此具有可复制性和可分析性。我们只是缺少合适的工具支持。恰恰是在AI领域,我们仍有很大的提升空间。也正是在此领域,市面上各种AI系统能给用户多大程度的支持会变得显而易见。

IDS在AI领域与各研究所和大学一起研究与工作,旨在开发这些工具。在IDS NXT Experience Kit软件中,已经提供了这种合作的成果。以所谓的注意力图(热图)的形式进行可视化,使人们更容易理解AI的关键决策,以便最终在工业环境中提升人们对神经网络的接受度。该成果还可以用来识别和避免训练的数据偏差(见“注意力图”)。很快,在基于云的训练软件IDS lighthouse以及在IDS NXT相机中,能够使用“混淆矩阵”进行统计分析,以便能更轻松地确定与理解经过训练的ANN质量。借助这些软件工具,用户可以更直接地将IDS NXT AI的行为和结果追溯到训练数据集中的薄弱环节,并有针对性地加以纠正。因而让AI对每个用户来说都具有可解释性和可理解性。

适用于工业用途的完整工具包

毫无疑问,人工智能的应用潜力是巨大的。带AI加速器的推理相机充分地证明了它的高效性,这表明我们已经能够提供合适的硬件。但仅提供硬件还不足以让全行业都开始使用人工智能。制造商面临的挑战是通过以易用软件和一体化流程的形式,分享他们的专业知识来支持用户。与经过多年发展成熟并通过大量文档、知识转让和多种软件工具建立了忠实客户群的最佳做法相比,人工智能仍有许多进步空间,但该技术已经在不断改进。为了进一步提高人们对AI的接受度和理解度,各项AI标准与认证正在制定中,旨在对人工智能进行广泛应用。最终的目的是让每个人都熟悉这项新技术,以免错过最佳时机。对此,IDS将发挥自己的优势。借助IDS NXT Experience Kit,嵌入式AI系统已经可以作为工业工具,快速而方便地操作,并通过许多易用的软件工具让任何用户群受益——即使这些用户群对机器学习、图像处理或应用编程没有深入的了解。