以数致交,以赛会友 — 在思想的碰撞中创造和传承数匠的智慧

供稿:北京天泽智云科技有限公司

2017年10月18日,由工业和信息化部指导,中国信息通信研究院主办的首届(2017)中国工业大数据创新竞赛决赛答辩会议在中国信息通信研究院隆重举行。会议由中国信息通信研究院总工程师余晓晖主持,工信部信软司副司长安筱鹏出席会议并致辞。




首届(2017)中国工业大数据创新竞赛自7月份正式启动以来,吸引了来自海内外近百个学校、公司、科研院校的1000多支参赛团队。竞赛决赛评审专家组由来自于清华大学软件学院院长王建民、美国辛辛那提大学教授、美国国家科学基金会IMS中心创始主任李杰教授,以及来自企业和研究机构的14位专家学者组成。进入决赛的12组选手中,有3支团队代表高校,9支团队代表企业,体现出工业大数据领域深度的产学融合。


安筱鹏指出,工业大数据的本质是通过数据驱动、软件定义、平台支撑推动制造业生产方式的变革和生产方式的迁移,推动工业大数据发展要围绕优化资源配置这一目标,解决发生了什么、为什么发生、下一步发生什么、如何改进优化四个问题,突破隐性数据显性化和隐性知识显性化两大关键,强化自动控制与感知、工业软件、工业网络、工业云和智能服务平台四大基础。最后,安筱鹏希望借助此次创新竞赛汇集科研界、产业界同仁,营造产业发展环境、提升企业竞争能力、培养一批人才,最终支撑制造强国建设。


李杰教授认为,这次比赛可以说是一次创历史的事件,是中国举办的首届工业大数据竞赛,对中国工业大数据技术的发展有着重要的意义。


王建民院长对此次竞赛予以了充分的肯定,并对下一届大赛寄予了更高的期望。他表示这次大赛的数据量相对“小”,希望下一届的数据更“大”;同时也鼓励团队的组建要更加跨界,才能互相取长补短。


美国自然科学基金智能维护系统中心(IMS)作为战略合作单位,天泽智云科技有限公司作为协办单位,对大数据竞赛提供了从策划、选题、验证、答疑和评审的全程支持。天泽智云首席数据科学家晋文静博士作为决赛评审出席本次会议。


为了持续推动工业大数据竞赛在中国的发展,并使更多对工业大数据领域感兴趣的同仁受益其中,晋文静博士对工业大数据竞赛的意义和举办过程进行了解读。


Q:举办工业大数据竞赛在中国是头一次,在国外类似活动的发展情况是怎么样的?


本次大赛是中国通信院第一次以本土公司的真实运营数据作为比赛基础数据,从实际应用出发,研究工业场景的典型问题。竞赛邀请了多位业界、学界的专家学者,结合各参赛选手的答辩汇报,对风电行业切实关注的问题提出了很多有价值的建议和看法,是一次非常好的“产学研”合作活动。


在美国,早在2008年就开始举办数据分析竞赛的活动,虽然那个时候大数据的概念还没有出现,但是工业界中利用数据进行分析建模的需求大量存在。美国首届大数据竞赛由国际PHM学会和NASA共同举办,题目是航空发动机的剩余寿命预测,总共提供了近500个发动机的全生命周期仿真数据。这项赛事随后成为了传统,主要由国际PHM学会和国际电气工程师学会(IEEE)主办,至今已经有10届了。IMS中心从第一届竞赛开始就是竞赛的常客,总共获得过5届冠军。


Q:为什么将选题定在风电领域?


工业大数据竞赛强调的是工业应用场景下的大数据。收集数据并不是目的,结合工业应用的机理,应用智能分析的算法解决工业应用中是问题才是目的。选择风电作为这次大数据竞赛题目,一是风电行业自身在工业领域的重要性,二是风电行业数据的可用性和完整性。在工业大数据领域,风电是起步比较早也比较成熟的领域,但是各个领域的发展都很快,我们期待明年会有更多的领域和企业为大数据竞赛贡献数据。


Q:为了确保公平,大赛对规则进行了哪些调整和优化?如何确保数据评估的准确性?


本次竞赛使用的数据是金风科技和北京工业大数据创新中心提供的的风机数据,天泽智云的数据科学家团队对数据和题目进行了验证。在三方的共同努力下,对大赛题目经过多轮的讨论才完成中国首届工业大数据竞赛的面世。数据和题目的准备历时3个月进行反复的修改和验证,主要的工作包括:


a.从对数据质量的评估,例如数据在脱敏处理中数据的信息丢失。

b.如何更好地强调本次大赛的工业属性,才能够吸引更多的选手结合人工智能算法和机理模型,这样胜出的队伍才可能对工业界有更多的贡献。

c.数据的竞技性。对提供的数据有更高的要求。本大赛的目的也是能够从业界和学界看到大家对于工业应用领域的先进分析方法,并能够应用到实际的应用场景中,对于题目的难度,我们对于如何提升题目的竞技性做了许多的设计,例如建议将故障的预测时间提前,一方面增加比赛的难度,另一方面也争取建立能够更早预测到早期故障的模型。

d.建立合理公平的评分规则,尤其突出早期故障探测算法的优越性。


Q:本次竞赛对中国工业大数据的发展会起到哪些推动作用?


我们关注到竞赛选手们应用了很多先进的人工智能的先进算法,包括深度学习算法,XGBoost,迁移学习算法,并且取得了一定的成效,这也是评估先进AI算法在工业大数据的一个很好的应用案例;考虑到工业属性,大数据竞赛鼓励选手应用行业洞见,结合机理建模和机器学习的方法提取有效的具有物理意义的特征;能够真正理解工业应用场景,考虑应用的实用性和现实条件的限制,例如运算速度,模型的泛化能力,等等,从而寻找最适合工业大数据的算法。


本次竞赛强调了工业大数据的应用重在预测,体现了算法应用在工业场景当中的可行性,吸引了更多的产、学界专家参与研究讨论,对工业尤其是风电行业的产业链当中的风机OEM、运营服务商、业主等企业在有效运用大数据和算法模型提升效率和优化资产等方面有很好的启发性和积极的推动力。


Q:本次竞赛结束后,我们还可以有哪些期待?


为了让此次竞赛中产生的知识被传承和传播,我们将继续协助信通院编写工业大数据竞赛智能分析白皮书,运用工业智能算法和基于机理模型的分析法,为大家介绍工业大数据的标准解法流程和竞赛中优胜选手的分析方法,欢迎大家关注。




晋文静 博士

天泽智云首席数据科学家


美国辛辛那提大学智能维护系统中心机械工程博士;2015年全美国制造工业未来最有影响力的30位杰出青年领导人(唯一一位华人入选),在工业智能制造领域参与全球最前沿性技术研究与实践,是美国工业智能以及工业4.0领域年轻科学家。


晋文静博士的研究包括当前工业智能制造领域最具应用场景与发展的诸多方向,包括了工业智能深度学习、基于加速预测与健康管理、旋转机械的故障诊断与寿命预估、智能传感器的性能衰退预测等等。晋文静博士同样有着丰富的工业实施经验,参与了精密机械零组件、线性传动系统、高铁、工业电机等工业领域的系统健康管理与寿命预测项目,并对于机电系统的智能监控安装与测试拥有丰富的实践经验。


晋文静博士参与的合作项目与合作方包括美国GE,Woodward,TechSolve,欧洲Alstom,高聖,美国施乐帕克研究中心(Parc)、意大利Alstom,台湾上银等等。

发布时间:2017年10月23日 14:16 人气: 审核编辑:刘婷
更多内容请访问(北京天泽智云科技有限公司

我有需求