大模型时代下智能故障诊断如何发展,清华综述《大规模基础模型在预测和健康管理(PHM)中的应用》

创建时间:2024-04-22 15:28

源自:北京科技大学机械工程学院

作者:陈哲涵 黎学臻

1.引言

图1。从AI-1.0到AI-2.0,深度学习的研究范式发生了巨大的变化。

在过去的两年中,大规模基础模型(LSF-Models)[56,57],如GPT-3[58,59]和ChatGPT[60,61],已经展示了具有流畅文本对话的高度智能的自然语言理解能力。大规模的多模态文本和图像理解模型,如gtp -4 [62], DALL-E-2[63],以及segment anything model (SAM)[64],进一步展示了该研究范式在多模态对话、图像生成和分割方面的非凡成就。基于人工智能的深度模型已从单模态、单任务、有限数据研究范式(AI-1.0)迅速发展到多模态、多任务、海量数据、超大模型研究范式(AI-2.0)。图1清楚地显示了这两种研究范式的差异。AI-2.0的核心是具有跨领域知识的LSF-Model,可以理解数据的一般概念,实现Zero-shot对不可见数据进行泛化,无需额外训练[64]。该模型的实现主要基于以下三个关键部分:有效特征提取模型[65-68]、无监督表示学习算法[69-71]和多模态融合算法[72,73]。此外,广泛的未标记或标记的多模态数据是这种开发的先决条件。然而,在PHM领域如何构建具有跨领域知识的LSF-Model仍然是未知的,对于如何开发适合PHM领域的特征提取、表示学习和多模态融合算法也缺乏足够的研究和分析。此外,PHM领域如何应对人工智能领域的这一巨大变化还没有定论,缺乏系统的文献综述,以及未来研究方向的路线图。为了填补这一空白,本文首先系统介绍了lsf模型的关键组成部分和研究进展。然后,系统地回答了如何建立适用于PHM领域的有效lsf模型。我们也阐述了这一研究范式将面临的挑战和未来发展的路线图。

具体来说,本次调查的主要工作总结如下:

1)本文对lsf模型的三个关键组成部分及其各自的研究进展进行了综述。

2)结合PHM领域的实际情况,系统地分析并回答了如何建立适用于工业PHM应用的有效lsf模型。

3)本文讨论了LSF-Model在PHM领域的研究路线图,并详细分析了该研究范式面临的挑战和解决方案。

2.大规模基础模型的关键组成部分

介绍了一些基本知识:Transformer架构的提出为基础模型提供了强大的特征提取能力[66,68]。自监督学习促进了基础模型强大的无监督特征表示能力的发展[69,70]。此外,多模态融合算法使基础模型具备了跨模态交互的能力[72]。

3.大型地基模型研究进展

对LSF-Models在NLP和CV领域的发展进行了广泛的概述和论述

4.PHM的大型基础模型

虽然深度学习模型在PHM中取得了显著的成绩,但由于它们通常是针对特定领域和任务进行训练和优化的,因此其有效性有限。因此,在复杂和开放的行业场景中,深度学习模型可能会表现出一些局限性,如局限性的泛化、多任务和认知能力。现有的模型可能在已知的情景下表现良好,但要有效地推广到未知的情景是有挑战性的[192-194]。这种零镜头泛化能力的缺乏使得它难以应对实际工业场景的复杂性。此外,现有的深度模型通常专注于单个任务。然而,工业设备有数百个核心部件,都需要健康监测和故障预测。为每个核心组件开发相应的深度模型是不现实的。最后,现有的深度模型认知能力有限,难以理解工业数据的本质和一般概念,往往会产生难以理解和错误的结果。

lsf模型的研究为我们提供了一种有效的解决方案,可以成功地解决上述问题。如第3节所述,现有的lsf模型,如ChatGPT[62]和SAM[64],表现出了出色的数据理解能力、零次泛化能力和强大的多任务能力。此外,它还具有一定的高级认知能力来解决一些推理任务。因此,LSF-Models的成功标志着人工智能领域的研究范式从单模态、单任务和有限数据研究范式(AI 1.0)向多模态、多任务、海量数据和超大模型研究范式(AI 2.0)的转变。然而,如何在PHM领域发展LSF-Model还没有定论。为了促进LSF-Model在PHM领域的研究和应用,本节从四个方面对如何构建适用于PHM应用的LSF-Model进行了说明和分析。

 

4.1 PHM的大规模数据集

 

4.1.1研究现状

与NLP和CV领域不同,PHM领域的数据一般是由各种传感器采集的高频或低频时间序列数据,如振动信号[195]、声音信号[196]、电流电压[197]、温度[198]、压力[199]等。此外,一些应用尝试使用视频和图像数据来实现设备健康监测,如跟踪缺陷监测[200,201],缺陷产品识别[202,203],设备裂缝监测[204,205]。目前,PHM社区已经开源了几十个不同规模和领域的数据集,如轴承故障数据集[206]、轴承退化数据集[207]、齿轮箱故障数据集[208]、飞机发动机退化数据集[209]、三相电机故障数据集[210]、工业生产监测数据集[211]、风力发电机监测数据集[212],等等。CWRU轴承数据集[195]是最经典的故障诊断数据集,仅包含有限的工作条件和4种不同的健康类别,每一种故障类别仅包含3种故障程度。Wang等[207]发布的XJTU-SY轴承数据集仅包含15个轴承从健康到故障的退化数据。Lessmeier等[213]发表的数据集包括来自32个轴承的振动信号数据和来自驱动电机的电流数据。Wang等[211]发布的晶圆缺陷识别数据集包含38,000个晶圆数据样本,包括38种不同类型的混合缺陷类别。Chao等人[209]开放了涡扇发动机退化模拟数据集,该数据集包含8组128台机组的数据,有7种失效模式。可以看出,这些数据集的规模非常小,满足LSF-Models训练和优化的需求具有挑战性。基于这些数据集训练的深度模型难以理解PHM数据的性质和规律,难以具备多任务和零拍泛化能力。因此,在PHM领域构建大规模数据集是实现lsf模型的第一步。

工业互联网和物联网(IoT)技术的出现[214]使得现代工业生产设备和各种复杂的机械设备上安装了大量传感器,以便实时监测系统的各种物理量,以便及时发现异常。因此,大多数大型企业都收集了大量的行业数据,并建立了相应的数据中心。例如,中国城市轨道交通列车拥有数十年的运营经验和实际运营数据的积累,形成了庞大而全面的数据集[215]。现在,一辆列车可以实时监测和记录与子系统、部件和外部环境相关的数百个变量,如轴承油温、变速箱噪音以及各种系统的电流和电压。类似地,轨道检测车可以获得密集的参数,如轨道轨距、水平和高度的扩展距离。这些海量的数据集提供了列车实时状态、退化过程以及列车子系统和部件之间相互依赖的宝贵信息。它们共同为建立lsf模型奠定了基础。

尽管这些工业数据在构建lsf模型以解决各种PHM任务方面具有显著的潜力,但仍需要进一步探索。工业数据可以包括各种传感器数据,如信号、图像和视频,以及大量的文本信息,包括维修工作单和报告。因此,建立lsf模型来有效地利用多传感器数据提出了新的挑战。此外,对于LSF-Model的构建,单个数据中心的数据规模可能会受到限制。例如,GPT 3.0[58]的训练数据超过4100亿个令牌,而GPT 3.5[60]的训练数据可能显著超过GPT 3.0。为了解决这一问题,跨中心或区域联合深度模型训练和优化是一种可行的解决方案。但是,这些行业数据通常会涉及商业秘密,所以政府和企业建立了严格的数据保护制度,极大地限制了行业数据的共享和使用。

(模型的能力和潜力已经被证明,数据量有限也是亟需解决的问题,如何设计训练任务,例如整合已有的数据集,并开展有效的数据学习和模态对齐;工业界的大模型构建,有些方面是可以去借鉴的,关键部分还是要有新的理解和突破。)

 

4.1.2解决方案

虽然LSF-Models在NLP和CV中都有很好的结果,但PHM领域的数据与前两者有明显的不同。因此,有必要根据PHM领域特有的数据特性,对lsf模型的关键部件进行优化和改进,以在该领域取得可观的性能。这需要探索新的特征提取模型,自我监督表示学习算法,以及适合PHM领域的多模态融合算法。此外,在工业领域,学术界建立了最前沿的算法设计和数据分析能力,而工业界则积累了大规模的工业监测数据。因此,建立校企联合研究中心,充分发挥各自优势,将有效应对现有挑战,显著促进LSF-Model在PHM领域的研究。

此外,LSF-Models的实现需要访问大规模数据。在利用这些数据的同时确保数据隐私保护是另一个值得注意的关键问题。与NLP和CV领域不同的是,相关数据可以从互联网上大规模获取,而PHM数据集则掌握在设备运营商手中,往往非常珍贵,可能包含商业秘密。此外,随着对数据隐私和安全的日益关注,监管机构也出台了新的法律来规范数据的管理和使用[216]。因此,有必要开发符合严格隐私保护法规的解决方案,并解决数据碎片化和隔离的挑战。联邦学习[217,218]是一种具有隐私保护和安全加密的分布式机器学习框架,是一种可能的解决方案。它允许分散的参与者在机器学习模型训练上进行协作,而不会将私人数据透露给其他参与者。目前,PHM领域已经提出了基于联邦学习的数据隐私保护解决方案[219-221]。图6为基于联合学习的多车多中心数据隐私安全保护架构。然而,现有的大多数联邦学习算法还没有应用到真实的工业大规模数据分析中。因此,推动大规模的工业数据分析和LSF-Models的建立,需要学术界和工业界的共同努力。

(大佬们估计已经悄悄着手了,组里做模型安全的博士就靠着联邦学习的研究毕业了)

 

图6。多车多中心数据隐私安全保护联合学习框架流程图(1-发送加密梯度 2-安全聚合)。

 

4.2 PHM Transformer

 

Transformer[75]是一种深度学习模型,专门用于建模长距离特征相关性,允许建模信号中任意两个位置之间的相关性,而不考虑特征之间的实际物理距离。其高效的长期依赖建模能力使其非常适合分析和处理PHM领域的各种传感器数据。因此,Transformer在各种PHM应用中得到了广泛的应用[42,222 -224],取得了令人印象深刻的性能结果。Jin等人[224]提出了一种基于时间序列的Transformer模型,与传统的CNN和RNN模型相比,该模型具有更强的故障识别能力。Wang等人[42]提出了一种基于Transformer的高速列车轮毂磨损预测模型,该模型利用Transformer和CNN的优势,对全局和局部信息进行有效编码。Fang等[222]对Transformer模型进行了优化,提出了一种基于Transformer的轻量级故障诊断框架,在降低计算复杂度的同时实现了高效、准确的故障诊断。尽管在PHM领域取得了显著的成功,Transformer模型仍然有一些需要解决的局限性。首先,Transformer模型主要是为处理静态输入数据(如文本)而设计的,虽然它可以通过位置编码合并时序信息,但它并没有直接考虑时序信息[225]。因此,Transformer在处理工业时间序列数据时,很难充分了解数据的连续时间关系。其次,Transformer模型可能不能很好地处理有噪声的工业数据。在真实的工业生产过程中,包含噪音的工业数据是常见的,Transformer模型可能不够健壮,无法处理这些噪音数据。第三,如前所述,工业数据往往包含多种类型的传感器数据和大量的文本信息,这对设计提出了新的挑战。Transformer模型通常不能同时处理大量传感器数据。

 

4.2.2解决方案

由于Transformer模型的实现基于自注意机制,因此它在考虑时间序列数据之间的时间关系方面面临挑战。自我注意机制局限于只考虑序列中位置之间的关系,缺乏在时间轴上捕捉相对时间关系的能力。为了解决这个问题,可以采用几种方法。首先,可以将时间编码机制集成到Transformer模型中,以方便直接学习时间关系。其次,可以研究一种有效的时间注意机制来捕获Transformer体系结构中数据之间的时间依赖关系。最后,基于Transformer的时间序列模型,如时间序列Transformer[226],可以考虑传感器数据的特性进行探索。这些模型需要专门设计来处理时间序列数据,整合全局时间序列信息,并改进时间相关性的建模。

在工业领域收集的数据往往包含复杂的噪音,不像NLP和CV领域的数据通常是干净的。因此,现有的大多数深度学习模型都不能很好地处理时间序列信号上的噪声或无关信息的干扰。在传统的信号分析中,人们提出了各种方法去噪,提取有价值的信息。这些方法包括时域和频域滤波[227,228],快速傅里叶变换(FFT)[229,230],小波变换[231,232]等。因此,Transformer与信号分析技术的深度融合是解决这一问题的一个很有前途的方法。例如,Rao等人[233]提出了一种基于fft的全局滤波层来取代Transformer的自注意机制,从而获得了更好的性能。同样,Wang et al.[41]通过将小波变换与深度学习模型进行融合,在噪声环境中获得了最佳性能,本文提出的多层小波模型如图7所示。然而,如何赋予Transformer更先进、更有效的信号分析能力,还有待进一步研究。

最后,为了同时处理多传感器数据和工业文本数据,有必要重新设计Transformer架构并创建多模态Transformer[234-236]。多模态Transformer的主要思想是将不同类型的数据(如文本、图像和音频)嵌入到Transformer模型中,从而在处理多模态数据时支持端到端建模。有几种解决方案是可行的,包括基于Transformer的多模态嵌入、基于Transformer的跨模态预训练和基于Transformer的多模态注意。多模态嵌入编码并将各种传感器数据嵌入到Transformer体系结构中,以同时表示多传感器数据。交叉模态预训练利用各种传感器数据对Transformer进行预训练,从不同的数据类型中学习有价值的信息,然后应用于下游的多传感器数据处理。多模态注意是利用多传感器信息实现自适应融合的常用方法注意力权重。

(在我看来对于大模型的实现,模型的架构是其次的,数据量和模型参数量的积累和提升才是最关键的)0

 

图七。多层小波模型的基本结构,深度融合了小波变换和CNN的优点,使其具有较强的抗噪能力(图像来自[41])。

 

4.3 PHM的自监督学习

4.3.1研究现状

如前所述,在工业生产和设备运行过程中,需要采集大量的传感器监测数据。然而,学术界和业界都在努力充分利用这大量的运营数据来构建PHM模型。主要的挑战是标签数据的不可用性、噪声的存在和大数据量。因此,现有的深度模型很难从这些数据中有效提取有用信息。自监督学习[70,124]可以从大量无标记数据中自动学习有价值的特征表示,已成为构建PHM基础模型的核心算法。目前,自监督学习已经在PHM领域进行了研究和应用[237-241]。例如,Zhang等人[239]开发了一种融合先验知识的自监督算法,并在小标记数据集上展示了良好的故障识别能力。Wang et al.[49]提出了一种新的自我监督表征训练的借口任务,该任务能有效地从无标记信号中提取有价值的信息。同时,Ding等人[237]开发了一种基于对比学习的训练前算法,该算法在识别轴承早期故障方面表现良好。

虽然自我监督学习在PHM领域显示出了巨大的潜力,但它需要设计有效的借口任务来学习有用的特征表示。当前的托词任务可能不能充分捕捉故障和健康相关的信息,特别是在复杂的工业系统中。此外,自监督学习模型可能对噪声很敏感,在数据质量较差的情况下,会影响学习到的特征表示,从而降低故障诊断性能和健康管理。此外,现有的自我监督学习算法难以处理包含多个传感器模式的真实工业数据。因此,开发有效的、能够处理此类工业数据的自监督表示学习算法是一个关键的研究领域。

 

4.3.2解决方案

lsf模型研究的基本目的是实现少镜头或零镜头的泛化。因此,在设计模型和算法时需要解决的首要问题是:什么样的模型和算法可以实现零次泛化[64]?类似于自动编码器的架构[53],特别是那些与信号重构、信号补全、信号去噪等相关的架构,构成了一个有效的解决方案。然而,它们的特征表示过程缺乏与健康信息的直接关联。因此,在制定托辞任务时,必须确保与设备健康的最大相关性。

在PHM领域中,频域比时域更能有效地反映设备的故障和健康状态信息。此外,从频域水平分析可以更好地处理噪声干扰,提高模型噪声的鲁棒性。因此,在构建自我监督学习任务时,必须综合考虑信号频域信息。对此有几种可能的解决方案。1)在自监督学习算法中同时利用时域和频域特征,可以融合成统一的特征表示。该方法以原始时域数据和相应的频域数据为输入,训练多模态自监督学习模型,学习时域和频域特征。2)开发深度频率空间学习模型,如基于小波的CNN[41,46,47],可以直接学习频率特征,捕捉数据中的频率信息。3)构建依赖于信号频域数据的托词任务,如频域信息重构。4)建立基于信号时频一致性的对比学习算法[242],对时间序列数据进行有效的自我监督训练。5)多传感器数据的相关性可以用来构造借口任务。例如,可以利用部分传感器数据预测其他传感器数据的值,从而诱导模型学习多传感器之间的直接相互依赖关系,便于工业多传感器数据的特征表示学习。最后,不同的自监督学习算法可以表示数据的不同特征信息。结合多种自我监督学习算法可以帮助模型学习更多样化的特征表示集,提高下游任务的性能。因此,在实践中采用各种算法对模型进行全面的预训练是一种很好的解决方案。

 

4.4 PHM的多模态融合

 

4.4.1研究现状

在PHM领域中,主要的数据源是由各种传感器获得的离散时间序列数据,包括振动信号、电流电压、温度和压力。此外,某些应用程序试图利用视频和图像数据进行设备健康监测,如跟踪缺陷监测、缺陷产品识别和设备裂缝监测。工业领域的数据,可能包含许多传感器数据类型(例如,信号、图像、视频等)和大量的文本信息(例如,维修工作单、维修报告等)。因此,相对于NLP和CV领域,PHM领域更注重多传感器数据的信息融合,从而更全面地了解设备的健康状态。目前已有多篇论文对多传感器信息的融合进行了研究[243-248]。例如,Yang等[243]提出了一种基于峰度加权算法和金字塔原理的多传感器多尺度融合模型,在轴承健康识别方面表现出了较强的性能。Long等[245]利用Hilbert变换和FFT从多传感器信号中提取有价值的频率信息,建立了基于注意的故障识别模型。Kumar等[248]同时考虑了振动和声音信号,利用小波变换作为特征提取器,随后将机器学习方法应用于故障诊断。

然而,现有的数据集大多只包含1 ~ 3个传感器的数据,远远不能满足实际工业应用的需要。此外,随着传感器数量的增加,不同传感器产生的数据可能具有不同的分布、尺度和信噪比。适当的预处理方法和融合策略对PHM模型的性能至关重要。此外,在工业领域,多模态融合算法必须考虑各种工业传感器信息(如信号、图像、文本等)的融合。然而,现有研究缺乏足够的解决方案和优化策略来应对这一挑战。

 

4.4.2解决方案

PHM中有效的多传感器数据融合需要在数据融合、特征融合和模型融合方面进行综合研究。以下解决方案可以增强模型的多传感器融合能力:

1)探索新的方法,将来自多个传感器或源的数据集成为一个统一的数据表示,考虑到每个传感器的独特特征。这种数据融合方法可以提高模型在处理不同模态数据时的性能和稳定性。

2)针对特定的任务和数据特征构建适当的注意机制,实现高效的多传感器关联建模,融合传感器有价值的特征。这种机制使模型能够捕获传感器之间的相关性,并突出相关的特征。

3)优化模型的结构和参数,更好地适应不同传感器数据的特性。此外,对于不同的传感器数据,建立不同的模型,然后采用模型融合算法,建立模型之间的连接,实现多传感器信息融合。通过根据不同传感器的具体特性定制模型,可以提高性能,并做出更准确的预测。

4)研究基于图神经网络(GNN)的多模态融合算法[249-251],可以对多模态数据之间的复杂关系进行建模。该方法利用GNN构造多模态数据的图结构,以不同传感器或数据类型的信息作为节点输入,实现多模态数据的融合。

最后,上述解决方案均为通用性解决方案,需要针对特定的数据和应用充分结合特征提取模型和自监督算法,才能达到最优的多模态数据融合性能。

5.挑战和未来路线图

在前一节中,我们讨论了在PHM领域中构建lsf模型的技术细节和可行的解决方案。本节试图从更广泛、更全局的角度讨论这些模型的挑战、路线图和前景。通过这样做,我们可以更好地了解更大的图景,并确定PHM领域有待改进和未来研究的领域。

 

5.1大型基础模型在PHM中的挑战

LSF-Models在PHM领域面临的挑战如图8所示,主要包括数据集、安全性、可信性、可迁移性、高级认知性、可解释性和边缘设备部署七个方面。下面将详细描述它们。

 

5.1.1大型数据集

企业不愿向竞争对手披露其商业敏感信息,包括重要设备的性能参数、维护记录和生产过程故障。这些信息可能被竞争对手利用,以提高竞争力或损害企业声誉。用于PHM应用的工业生产数据和机械设备运行监测数据将不可避免地涉及这些商业敏感信息。因此,企业建立了严格的数据保护措施,导致PHM领域大规模的可公开访问的行业数据严重缺乏。此外,现代工业设备通常在复杂和无限的环境中工作,导致数据的收集经常充满噪音、丢失数据、失真、异常干扰等问题。此外,部署的各种工业传感器阵列导致采集不同的数据类型,需要处理不同的模态数据。因此,利用这些数据构建有效的大规模PHM模型具有挑战性。

图8。lsf模型在PHM领域面临的挑战


-大规模数据集----安全性---------可信度----可迁移性---高级认知------可解释行--------边缘设备部署-----
---------商业敏感信息---对抗攻击----结果可靠性-应用不同----一般概念(常识)--内部机理----资源有限--
---------工业数据分析---偏差和错误----鲁棒性----任务不同----一般特征--------------理论基础----时间敏感性-

 

5.1.2安全

尽管lsf模型已经在大量数据集上进行了训练,但它们仍然容易受到安全威胁,如对抗性攻击[252]。对抗性攻击可以通过设计良好的噪声干扰PHM模型的输出,导致模型产生错误的结果。这在关键的PHM应用中是不可接受的,如核电站的安全监测。在对大规模数据进行训练的过程中,除了直接攻击外,还可能引入无意的偏差或错误,从而导致模型输出有偏差甚至错误的结果。在这种情况下,PHM模型可能存在安全风险,并且很难排除故障,因为特定的偏差和错误结果只在特定场景中偶尔出现。此外,由于lsf模型需要大量的计算资源进行训练和推理,因此容易受到针对计算资源的攻击,如DDoS攻击[253,254]和恶意软件攻击[255,256]。

 

5.1.3可信度

LSF-Model的可信度[257]表示用户对其输出的准确性和一致性的信心。此外,模型必须承受诸如偏差、噪声和输入数据扰动等干扰,同时保持预测的准确性和稳定性。目前,LSF-Model的可信度较传统的深度学习模型有了明显的提高。然而,在PHM领域,复杂的工作条件、不同的背景噪声和不同的旧设备导致数据分布差异较大。因此,提高lsf模型的可信度仍然是一个重大的挑战。

 

5.1.4可迁移性

LSF-Model的可移植性是指模型是否能够很好地迁移和适应不同的任务和数据集。在PHM领域,不同的场景需要不同的任务(如异常检测、故障预测、RUL估计)。然而,这些PHM任务的性质和执行是非常不同的,如何在不同的任务之间实现相当大的可转移性和适应性是一个挑战。此外,不同的机械设备具有不同的性能;例如,轴承、齿轮箱和曲轴都是核心旋转设备,但它们的失效特性和性能差别很大。另一个挑战是如何处理这些差异,使lsf模型在各种应用中具有较强的可移植性和适应性。

 

5.1.5高级认知

目前对大规模语言和视觉模型的研究表明,lsf模型具有高级的认知能力,可以在一定程度上学习一般概念[62,64]。然而,目前还不清楚这些模型是如何获得这些能力的,以及如何明确地增强它们。此外,PHM数据具有显著的随机性,这对模型从该数据中概括高级认知提出了挑战。相对于具有规则性的文本和视觉数据,时间序列数据的多样性使得模型难以提取广义特征表示。

 

5.1.6可解释性

可解释性[258-261]是指模型的决策和输出可以被解释和理解,而透明度是指模型的内部结构和操作可以被人理解和审查。然而,随着LSF-Models的发展,这些模型的内部工作原理和运行机制越来越难以解释和理解,透明度越来越低。此外,LSF-Models在训练期间可能捕获不可预测的数据关系和噪声,这可能导致重大的安全风险。在PHM领域[41,262,263],可解释性和透明度非常重要,因为在核能和航空航天等领域,缺乏透明度的模型难以获得信任。然而,lsf模型的复杂性使得研究其可解释性和透明性变得极其困难。

 

5.1.7边缘设备部署

lsf模型具有大量的参数和复杂的结构,需要大量的计算资源进行训练和推理。然而,在PHM领域,常常需要将监控模型部署到边缘计算设备或移动终端上,以满足实时性和安全性要求。然而,由于现有的边缘计算设备普遍缺乏执行lsf模型的能力,在不影响其性能的情况下实现此类模型的部署是一个重大挑战。因此,迫切需要设计新的技术来解决这个问题,并促进lsf模型在边缘计算设备上的部署[264-266],同时保持其性能。

 

5.2 PHM中大型基础模型的路线图

图9显示了lsf模型在PHM领域的未来发展方向。根据LSF-Models面临的挑战,本节探讨了如何解决这些挑战,并阐述了未来的路线图。下面将详细描述它们。

图9。lsf -模型在PHM领域的路线图。

 

5.2.1大规模数据集的路线图

在PHM领域构建大规模数据集的核心解决方案是消除企业对数据隐私和安全的担忧,特别是使所有企业都能获得利益,从而实现互利共赢。为此,PHM领域的大规模数据集的分析和利用可以通过以下方法来推进。

1)国际国内标准建设。首先,在学术界和行业的共同推动下,构建一套完整的标准体系,包括数据采集和存储标准等。然后,通过这些标准来规范行业内的数据采集方法、数据采集对象、数据采集频率、数据采集质量、数据存储格式、数据隐私保护要求。

2)建立行业数据联盟,实现数据共享。在政府或行业协会的推动下,成立行业数据联盟,在保护各企业商业秘密的同时实现行业数据共享,实现互利共赢。使用大规模行业数据建立的模型可以反馈参与的公司,以提高其产品的质量、可靠性和安全性。

3) .推进校企联合研究中心建设。在工业领域,学术界掌握了前沿的算法设计和数据分析能力,工业界掌握了大规模的工业数据。因此,建立校企联合研究中心可以协同发挥各自的优势,促进lsf模型在PHM领域的研究进展。

4)探索数据隐私保护算法。在保护数据隐私的同时,探索高效的跨数据中心大规模深度学习模型训练和优化算法。为了解决企业之间对数据隐私和安全的担忧,可以采用数据脱敏、加密等技术来促进数据共享。

 

5.2.2安全路线图

LSF-Models的安全性主要分为数据安全性、模型安全性和系统安全性。为此,可以从以下几个方面来提高LSF-Model的安全性。

1)确保数据安全。确保数据安全需要避免恶意篡改或污染数据,并避免向模型引入偏差或错误信息。因此,有必要确保模型的训练数据源是可靠的、高质量的、充分的和有代表性的。此外,还需要建立数据安全保护机制,防止恶意数据泄露和篡改。

2)确保模型安全。为lsf模型探索实用的对抗训练和正则化方法[267-269],以提高模型抵抗恶意干扰和噪声的能力。此外,增强模型的安全性和私密性,如模型加密[270-272],防止模型被盗或被逆转。

3)确保系统安全。对于基于lsf模型的PHM系统,建立监控系统,及时发现异常操作和攻击行为,同时记录操作日志和审计日志,对安全事件进行调查和跟踪。

 

5.2.3可信度路线图

提高lsf模型的可信度是一个综合性和复杂性的问题,可以从以下几个方面进行优化和改进。

1)提高数据质量。数据质量是模型训练的基础,保证数据质量是提高模型可信度的关键。因此,需要采取一系列措施来保证数据质量,包括数据清理、剔除离群值、数据增强等。

2)提高模型的鲁棒性。探索提高模型鲁棒性和抗干扰能力的新方法,如提高模型在有噪声[9,10,273 -276]、分布移位[277-281]和分布外场景[282-284]下的性能。

3)提高模型评价的综合性。评价的全面性和公平性是提高模型可信度的关键。为了实现这一目标,需要使用多个评价指标和多个数据集对模型进行综合评价,同时避免针对特定场景的模型偏差等问题。

4)保证模型可追溯性。为了提高模型的可信性,有必要对模型的开发、培训、测试、部署和其他过程进行充分的记录和跟踪。这样可以保证模型的过程是可控的,结果是可以验证的,从而提高模型的可信度。

 

5.2.4可迁移性路线图

进行lsf模型的目标是提出能够执行所有任务的通用模型的概念。本着这个目标,我们致力于创建一个全面的多任务PHM系统。为了实现这一目标,最重要的是尽可能地提高基础模型的可移植性和适应性。PHM领域包含了各种各样的下游任务,其应用对象是复杂的,因此需要探索新的架构设计方法、特征学习方法和训练算法,以适应真实的工业场景,以增强可移植性。

1)探索灵活的模型架构设计。为了构建通用的基础模型,有必要研究灵活的模型体系结构设计,这些设计可以针对不同类型的PHM应用程序(如监控、诊断、预测等)进行定制。

2)探索一般特征表示方法。从不同的数据类型中提取有价值的特征是实现通用模型的关键。这些特征表示算法需要能够捕获各种类型的故障模式,还需要对不同类型的故障数据具有鲁棒性。

3)探索适合PHM应用的训练算法。虽然在NLP和NLP领域已经提出了大量的自监督训练算法[49,69 - 71,124,125]CV,只有根据PHM领域特点设计的训练算法,才能最大限度地提高基础模型的可移动性和适应性。

 

5.2.5高级认知的路线图

lsf模型有潜力获得先进的认知,并从使用大量训练数据和精心设计的算法的数据中学习一般概念。在PHM领域,具有高级认知能力的lsf模型能够很好地理解工业数据的本质和一般概念。因此,LSF-Models可以迅速适应不同的工业场景和任务,有效地避免产生难以理解的输出。然而,目前的lsf模型所显示的高级认知能力还不够。除了扩大训练数据量外,还需要在以下几个方面进行探索:

1)探索数据需求,实现高级认知能力。虽然一些现有的lsf模型已经证明了有限的高级认知能力,但需要什么样的数据和多少数据才能达到这种能力是未知的。此外,如何充分利用数据信息,在相对较小的数据集上获得可观的认知能力也是一个值得研究的课题。

2)探索实现高级认知能力的模型要求。大多数现有的lsf模型采用Transformer架构,但它有局限性。因此,探索新的Transformer架构或设计新的模型架构,以使LSF-Models显示出更好的认知能力,是值得探索的领域。

3)探索实现高级认知能力的理论要求。高级认知能力的实现不能仅仅依靠大量的实验分析;这也需要适当的理论来提供指导性的解决方案。因此,利用lsf模型研究高级认知能力习得的原因和机制,将对该领域的研究起到重要的推动作用。

 

5.2.6可解释性的路线图

深度学习因缺乏可解释性和透明度而受到批评,这种缺陷在LSF-Models中更为明显。提高这些模型的可解释性和透明度将提高它们的可信性、可控性和可靠性,使它们更适合于在航空航天和核能等关键工业领域的应用。未来的研究可以从以下三个方面来解决这个问题。

1)探索深层可解释模型。在PHM领域,一种可行的解决方法是利用信号分析方法的理论基础,实现具有高可解释性的深度模型[41,46,47,263]。此外,将先验知识或物理背景信息纳入模型也可以显著提高模型的可解释性。

2)探索分析模型可解释性的方法。根据深层模型的特点,需要探索分析模型可解释性的实用方法。例如,通过使用可视化方法[41,48,285,286]分析模型的内部结构参数,使用信号分析方法分析模型的滤波器[287],了解模型学习了哪些特征。

3)推进深度模型理论研究。这就需要深入分析基础模型的原理,通过理论分析,探索其本质属性、特点、优缺点,揭示其内在机制和规律[288-290]。通过建立基础模型的数学模型,推导其收敛性、泛化性和鲁棒性等特性,揭示深层模型的内在机理。

 

5.2.7边缘设备部署示意图

尽管lsf模型的性能令人印象深刻,但其计算需求极大地限制了其适用性。为了促进lsf模型在PHM领域的应用,可以从以下几个方面进行探索,使lsf模型轻量化。

1)探索轻量级的深度模型。通过探索轻量级深度模型的设计方法[291,292],开发新的低复杂度算法和算子设计范式,可以降低模型的计算负荷和资源占用。

2)模型压缩和剪枝。可以探索模型压缩[293,294]和剪枝[295,296]技术来减小模型的尺寸。有效的压缩方法,如权重分配、低秩分解和知识蒸馏。此外,可以使用有效的剪枝方法消除冗余神经元或连接。

3)网络拓扑优化。探索新的网络拓扑设计方案,如脑激励尖峰神经网络[297,298],以实现低功耗和计算需求的深度网络模型。

 

5.3前景:通用PHM平台

传统的基于人工智能的PHM模型通常需要为每个子任务开发独特的数据处理和模型优化算法,以在特定场景中获得良好的性能。例如,需要建立独立的轴承故障诊断模型和RUL估计模型。然而,复杂的工业设备可能包含数百个核心部件,为所有部件建立相应的PHM模型是一个庞大的项目。此外,该应用范式不能充分利用工业设备的多模态关联数据,不能全面表征工业设备的健康状态。构建的各种子任务模型耗时费力,不能保证模型具有良好的泛化性能。如前所述,NLP和CV领域,如ChatGPT[62]和SAM[64],证明了LSF-Models在跨模态多任务场景中的出色表现,并在一定程度上实现了所有任务模型的思想。因此,受此启发,实现通用PHM平台成为可能实现所有PHM任务的一个模型。这一研究理念将彻底改变PHM领域的研究范式,实现通用PHM平台将显著促进PHM领域的综合智能化。

图10为高速列车通用PHM平台示意图。通用PHM平台的核心是大型跨模态基础模型。该模型接收来自高速列车的各种数据,如传感器数据(包括信号、图像和视频)、维修工作单和记录,以及专家的经验和知识,作为输入。随后,对高铁各子系统和核心部件的健康状况进行全面评估和监测。其中,采用多模态融合算法和自监督特征表示算法构建跨模态基础模型,使其能够理解和学习多模态列车数据的通用高质量数据特征。随后利用零/少镜头学习范式将跨模态基础模型扩展到各种训练PHM子任务,从而实现平台效应。跨模态基础模型的最终目标是通过学习大量的列车运行数据,为PHM任务(如健康监控、故障预测、异常检测、RUL估计、维护计划和健康管理)提供强大的、可泛化的数据挖掘和理解工具。即使对于训练过程中不存在的新对象和数据,跨模态基础模型仍然可以提供相当大的特征挖掘能力。因此,所提出的通用PHM平台有望成为PHM领域的核心工具,在提高工业设备健康管理效率方面发挥关键作用减少维护成本。

图10。通用PHM平台的原理图,以高速列车PHM应用为例。

6.结论

目前,深度学习研究正在经历一场新的革命,即单一模式、单一任务、有限数据的研究范式(AI 1.0)正迅速向多模态、多任务、海量数据、超大模型的研究范式(AI 2.0)发展。AI 2.0专注于开发具有跨领域知识的lsf模型,在海量数据集上进行训练后,具有较强的泛化和多任务能力。为此,本文对三大技术进行了全面的概述并分析了LSF模型在自然语言处理和CV中的研究现状。文献回顾表明,严重缺乏对LSF模型在PHM领域的研究,并没有可行的解决方案,如何建立LSF模型的PHM应用程序。因此,本文从四个方面全面回答了如何构建适合PHM领域的LSF-Models:数据集、深度模型、学习算法和数据融合。最后,本文试图从更广泛,更全球的角度讨论LSF模型的挑战和路线图。总体而言,本综述系统地介绍了LSF模型及其在PHM领域的研究现状、挑战、解决方案、路线图和前景,期望为该领域的未来研究提供有价值的指导。

声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。

 

 

 

扫描二维码

报名相应课程

浏览量:0
收藏