中瑞泰科技让工业大数据会说话论文

时间:2021-08-31

中瑞泰科技让工业大数据会说话论文

  十几年前,在数据对于企业的作用还不被认识,大数据为何物更是不为人所知时,一位25岁的青年却已经开始了在工业大数据领域的耕耘。

  是什么让他当年在从事自动化专业多年后选择这一相对冷门的行业开始了创业?又是什么吸引他一直坚持?在大数据、智能制造、工业4.0的概念如此响亮的今天,他又有什么感想和认识呢?

  《中国信息化周报》与北京中瑞泰科技有限公司(简称中瑞泰科技)创始人江涛和联合创始人黄咏博士展开了将近两个小时的访谈,畅聊工业大数据的来龙去脉。

十五年前

创立“工业大数据”公司

  《中国信息化周报》:您当年为什么会去选择创立中瑞泰科技?公司初期的发展情况如何?

  江涛:大学毕业后我一直从事自动化专业相关的工作,当时有两方面的感触:一是国内自动化工程主要采用的还是国外的产品;二是自动化市场竞争激烈,同质化竞争严重。1998年,我有机会接触到当时世界最先进的实时数据库技术,美国OSIsoft公司的PI系统(Plant Information System)。与传统的自动化系统不同,PI系统通过数据集成把底层控制系统的信息带到了管理系统层。大量的生产实时数据将成为自动化系统的一个新特点,我意识到在这一领域将会出现很多机会。现在回想一下,正是海量实时数据的价值推动我创立了中瑞泰科技。

  在公司成立之初,我们的业务重点有两个方面,一方面基于PI做应用开发,另一方面专注于实时数据挖掘的自主知识产权产品开发。在2005年,中瑞泰科技推出了自己的第一个产品——智能设备故障预警系统软件,这个软件通过对设备海量实时数据的分析和建模,实现实时故障早期预警,是我们目前的iEM System工业大数据平台的雏形。

  我们做这个技术时,是用数据的方法解决机理问题,同期也有美国的公司在做类似研究。其实这种技术在20世纪70年代已经具备了雏形,最早采用模糊数学、灰色理论等技术,但受限于当时的计算机技术,一直到2000年才具备应用条件。

  2005年我们的产品出来之后,已经能够解决很多应用问题,但大多数用户在意识和管理上还跟不上,只有部分用户很早就开始了相关的实践,例如秦山核电等。

  与目前铺天盖地的大数据和物联网相比,其实我们十年前就已经开始工业大数据技术的研究并形成产品了。

  《中国信息化周报》:黄总有怎样的职业经历?您对公司的产品发展有什么看法?

  黄咏:我在国企做设备维修和设备管理很多年,读完博士之后,又在外企做产品研发和技术服务,一直没有偏离自动化的专业方向。在我看来,自动化系统中的很多问题,都可以归结为建模问题。建模就需要数据,但实际上,在我们目前的自动化系统中,已经采集了很多数据,但这些数据并没有被充分利用。越来越多的人意识到这些数据的价值,如何利用这些数据已经成为瓶颈。主要的问题还是需要新的方法和工具来解读这些数据,这就是工业大数据技术的应用领域。

  经过这么多年的准备,我们的产品在大量的实际应用中得到不断完善和改进,从最初的预警系统到设备健康管理,从实时数据应用到工业大数据平台,其实从这个过程您也可以看到我们在工业大数据方面的坚持。

  工业4.0、工业技术物联网离不开工业大数据,但也只有在这个阶段,工业大数据才有机会成为推动力,催生很多行业机会。我们把中瑞泰的产品打造成工业大数据的应用平台,就是要让工业大数据技术好用易用,发挥数据的价值。

工业大数据技术的产业价值

  《中国信息化周报》:什么是工业大数据?工业大数据技术的特征是什么?

  江涛:工业大数据是工业企业与生产设备相关的大数据,工业大数据包括设备的设计制造数据,实时运行数据,检维修数据,缺陷、故障数据等等,工业大数据包含的面很广,但相对我们通常谈论的大数据,工业大数据有自己的特点。工业大数据中生产设备的实时运行数据是重点。

  工业大数据技术就是研究如何利用工业数据的技术,大家都知道数据中包含了设备的运行规律,但关键在于,如何发现规律?利用这些规律能干什么?能带来什么价值?

  关于工业大数据的概念,已经谈得太多了,但真正谈到工业大数据技术,其实还比较具体。

  总体上,工业大数据技术可以分为四个关键环节:机器学习,状态分析,关联分析和预测分析。机器学习是工业大数据的核心,机器学习就是通过对海量历史数据的分析建立工业大数据的模型,这是利用工业大数据的第一步,没有机器学习就谈不上工业大数据技术。

  然后是状态分析,我们其实更强调实时状态分析,就是利用工业大数据模型来对系统对象进行实时状态识别和评估。关联分析是工业大数据技术的另一个重要特征,其实工业大数据和我们通常说的大数据相比,数据之间的关联性更强更复杂,关联分析就是通过对关联性的分析,对事件发生时的因素进行识别。最后才是我们经常提到的预测分析,是利用工业大数据模型,对期望状态的一种运算。

  《中国信息化周报》:目前,实现工业大数据技术的主流技术有哪些?应用效果如何?

  黄咏:由于工业大数据的内容比较丰富,采用的技术也各种各样,不过在机器学习、状态分析、关联分析和预测分析等环节,各种技术的应用效果区别较大。

  首先是常规的统计分析方法,应用的很多,同时实际上并不是真正的机器学习技术,但是因为比较简单,因此用在大量的数据处理应用中。

  其次是聚类分析方法,通过构建分类器来实现对状态模式的自动识别,对于一些非实时性的需求,聚类分析方法应用起来比较简单,也有一些平台可以提供算法。

  人工神经网络是实现机器学习的一个常用技术,在工业大数据研究中也经常采用,但是建模训练比较慢,以及模型不唯一的缺点,使得在实际应用中遇到很多障碍。

  主元分析方法也是常用的方法,用在工业大数据分析中效果还不错,通常适用于有一定专家经验介入的系统场景。

  我们的iEM System工业大数据平台采用的是超球建模技术,直接在多维空间中分析工业设备对象海量状态数据,建模过程能够最大限度地保留数据中各个维度的信息,因此超球模型能够真实地反映设备的“工况-状态”模式。在应用中表现得比较好。

  整体说来,工业大数据领域有很多技术尝试,但iEM System做到了平台化和产品化。

  《中国信息化周报》:工业大数据技术的核心价值是什么?

  黄咏:iEM System智能平台带给用户的核心价值可以总结为四个字:“通、活、早、简”,也称为CAPS。

  “通”是打通孤立系统:我们现在的自动化系统都讲究网络架构,从拓扑结构上看,所有的系统都连起来了,但从数据上看,大部分系统还是孤立的。实际上数据就是各个系统不同的语言,大家“自说自话”,并没有实现我们预期的通过网络将系统互连的目标。而iEM System按照资产架构对数据进行重新组织,从设备视角建立状态模型,对状态实时评估,通过“健康感知”技术,让设备的状态变得简单明了,及时将状态变化推送到管理和分析系统中,这才真正打通了各个系统之间的数据和信息通道。

  “活”是激活数据资源:工业系统的实时历史数据积累的速度,远大于我们通过专家学习、分析和利用数据的速度,海量的数据资源在沉睡。而iEM System通过机器学习的方式,提取海量数据中的模式信息,充分利用计算机的能力,激活数据资源,提高分析和利用数据的效率。

  “早”是提前发现问题:基于iEM System工业大数据模型的实时状态评估,可以对工业系统或设备的整体状态实现量化评估,系统的任何问题发生的早期都会有一些异常的波动,iEM System可以提前发现这些波动,确保有充分的时间来处理问题。

  “简”是简化监控模式:传统的`自动化系统中,监控的对象是测点值的变化,因此要诊断设备故障,通常要通过看画面、查参数、比趋势、翻报警、看频谱等步骤,在iEM System工业大数据平台上,监控可以通过健康度曲线和关联测点的方式快速定位故障原因,这是在操作层面最有价值的一种改变。

  《中国信息化周报》:工业大数据技术有哪些具体的应用?

  江涛:目前工业企业在很多应用领域都锁定工业大数据技术为重点科研项目。从目前应用的情况看,在设备状态监测、故障诊断管理和系统性能优化等领域应用的案例较多,基于iEM System的设备健康管理系统在电力、石化等领域有一些非常成功的应用案例。

  《中国信息化周报》:基于工业大数据做健康感知、关联分析、预测分析,中瑞泰科技的技术门槛高吗?

  江涛:应该说还是有比较高的门槛的。它既要求有理论背景也要求了解用户的实际需求。我们这么多年还在不停地摸索和改进。我们的发明专利技术在国际上也得到了认可,可以说,这项技术属于国际领先水平。