基于GenPro的工业智能建模案例分享

供稿:北京天泽智云科技有限公司


2015年起中国工业的智能化转型进入加速赛道,构建以数据为驱动的生产运营能力、对数据进行建模分析和价值挖掘,已经成为绝大多数制造企业致力实现的目标。如何快速高效地完成模型开发及落地,北京天泽智云科技有限公司工业智能实验室干瑞在2019未来工业智能峰会上进行了详细解读。




一个典型的工业智能建模流程可以概括为以下几步:数据探索、数据预处理、特征工程、模型训练与调优、模型验证以及模型评估。


而工业大数据独有的碎片化、质量差及强行业属性的“3B”问题,直接导致工业建模的低效和高门槛,使制造企业在建模时不得不在数据清洗、整理、模型泛化训练等方面进行大量的重复工作,而且还需要有丰富的跨学科能力与经验积累作为支撑。


为此,天泽智云研发了工业智能建模平台GenPro,将核心技术团队多年来在旋转机械、风电、机加工等多个领域的经验转化为工业数据分析算子,制造企业可直接基于内置的建模算子及建模模版,通过简单的“拖拉拽”方式完成建模,并最终输出为物理世界的洞察、决策和知识,赋能制造企业有效可行地实现智能模型的研发和落地。


GenPro关键特性


下面结合风机叶片结冰预警的具体案例,来和大家分享如何通过GenPro帮助工业企业快速实现工业智能模型的落地。




叶片结冰会导致风机发电效率下降,甚至严重时对风机造成损坏,是风力发电中的一个常见问题。


但是通常除冰系统只能检测到严重的结冰进行自动除冰,很难发现早期结冰状态,而早期结冰的检测对于机组健康运行至关重要。因此如果能够检测出早期结冰状态,则能有效防止机组由于严重结冰导致的经济性和安全性下降的问题。


>> 建模原理


针对这个典型的样本不平衡的二分类问题,在建模时首先要根据维护记录生成标签,并利用机理模型提取风机性能相关特征,之后再训练机器学习模型预测叶片结冰故障。


>> 建模流程


GenPro提供了丰富的行业组件,可以满足不同的常见输入格式和场景,加速工业碎片化数据的处理效率及建模流程。


读取数据


首先需要读取建模所需数据,打开数据读入组件的返回结果,可看到每条数据的时间戳、风速、发电机转速、风机输出功率等能反映风机性能的参数。



生成标签


在GenPro标签生成组件中输入待打标签的数据和待打标签的区间信息,根据需求进行灵活配置(标签列、标签值、时间格式、偏移量等),快速完成所需要的打标签过程。


之后通过数据过滤组件,基于标签值过滤无效数据,将筛选之后的数据切换到绘图可视化界面,选择散点图可视化组件,查看风机风速-功率分布。



同时还可以根据标签值对数据点进行不同的染色,如蓝色的点是正常状态的数据,红色的点是结冰故障时的数据,从上图可以看到当结冰时,风速-功率的关系整体上会偏离正常的风功率曲线。


提取风机性能相关特征


接下来进行结冰预测相关特征的提取。从风机原始数据中选取发电机转速、风速、功率、风向和环境温度5个相关参数,运用风机性能参数提取算法组件,该组件从对机理的角度出发,得到的风机性能参数(如CP、TSR等)与叶片结冰故障存在较强的相关性,从而保障建立的结冰预测模型更加准确和稳定。


之后再利用滑动窗的方法进一步提取统计特征,例如最大值、最小值、均值、方差等,并且对标签做类似的处理,最终得到可用来训练结冰预测模型的数据。


训练机器学习模型预测故障


在训练模型前还需对数据进行拆分,一部分作为训练集训练模型,另一部分作为测试集来对训练好的模型进行评估,在该案例中我们采用60%的数据进行进行训练。


由于结冰预测的数据中结冰样本比例较小,为了避免样本不平衡对模型训练效果的影响,采用SMOTE算法组件对训练集中的结冰样本进行过采样,使样本类别比例平衡。


之后将训练集的数据输入到分类模型训练组件中,使用随机森林分类算法训练分类模型,再利用训练好的模型对测试集数据进行预测。


最后根据预测结果使用ROCAUC评价方法对模型进行评估,得出的AUC的值越大模型预测越准确(最大值是1),我们在该案例中的AUC为0.9+。


以上就是基于GenPro的风机叶片结冰预测模型建模的整个流程,全面涵盖了工业智能建模的全部环节。在此过程中除了一些标准组件,GenPro提供的特殊功能的组件起到了非常关键的作用,如通过根据时间打标签加速了数据预处理的过程,融入机理知识的风机性能参数提降低了建模门槛等,从根本上提升了工业数据价值闭环效率。



小 结


对机理的充分理解可以有效提升工业智能建模过程中碎片化数据的预处理效率,GenPro作为一款专为工业智能开发者打造的建模分析工具,内置丰富的行业算子与行业模版,能充分补足人才在领域知识、工业机理等方面的短板,降低建模门槛;同时在可视化面板、“拖拽式”画布等功能的支持下,可帮助工业智能开发者实现一站式、流水线式的建模,极大增强工业企业数据分析团队的生产力和创新力。


发布时间:2019年4月12日 14:37 人气: 审核编辑:陈佳利
更多内容请访问(北京天泽智云科技有限公司

我有需求