引言
众所周知,过程能力分析是指通过顾客质量要求的范围与实际产品质量变异范围之间的数值比较来衡量实际生产过程满足规格要求的能力。具体来说,就是根据公式1.1和1.2计算出过程能力指数Cp和Cpk值,确定其过程能力等级,判断过程能力是不足、尚可还是充分,进而采取相应的改进和维护措施。这个简单易行的量化管理工具已经在生产线能力评估、六西格玛项目、供应商审核等各个领域都有了广泛的应用。
其中USL为规格上限,LSL为规格下限 Xbar为样本数据的平均值,s为样本数据的标准差
但是,过程能力分析是以正态分布为前提的。也就是说,只有通过数据正态性的验证,才能应用公式1.1和公式1.2得出准确的分析结论。这就给我们提出了一个问题:如果收集到的数据是非正态的,应该如何进行过程能力分析?这个问题非常具有现实意义,因为很多流程或产品特性的数据往往就是非正态分布的,如寿命和可靠性试验中的数据。
目前解决这类问题比较常见的方法是“数据转换法”。即通过Box-Cox转换法或Johnson转换法将原始非正态数据转换为正态数据,然后再按常规步骤进行过程能力分析。不过,相当数量的工程技术人员对这种方法的负面评价是:并不是所有的原始数据都能找到合适的转换方法,即使能够找到转换方法,也会因为数据和规格上下限都发生了变化,增加了理解上的难度,减少了现实指导意义。
一、新方法背景说明
那么,是否存在更好的解决方法来执行非正态数据的过程能力分析呢?本文将结合英特尔、陶氏化学等已经广泛应用统计技术熟的企业的实际经验,以案例分析的形式结合高端六西格玛软件JMP,介绍两种实用的新型解决方法——分布拟合法和百分位数法。JMP目前的应用领域包括业务可视化、数据发现、六西格玛和持续改进、研发和创新、实验设计DOE等等。
案例介绍:在某化工生产过程中发现,当催化剂接近耗尽时,收集到一批表示杂质含量的数据(共125条记录,部分内容可参见图一),已知对杂质含量的要求是不得超过24,试用正确的方法计算出过程能力指数。
根据传统的过程能力分析方法,即应用公式1.2,在JMP软件的协助下容易计算求得Cpk=0.602,如图二所示。但是从上图左侧表示原始数据分布的直方图和箱线图不难发现,该组数据明显不正态(右偏),因此有必要使用更合适的方法重新进行过程能力分析。
二、分布拟合法
先来说说“分布拟合法”。顾名思义,这种方法首先需要拟合确定源数据的最佳分布模型。这一步骤本来十分复杂抽象,但是运用JMP软件,可以快速准确地得到如图三所示的模型比较报表。根据相关评价指标(如BIC)的显示,Lognormal对数正态分布最适合该组数据。
其次,修正传统的过程能力指数的计算公式。对于正态分布的过程,典型的流程分布宽度定义为6倍的标准差,也就是过程标准差的+/-3倍,这两个界限值(Z下限=-3, Z上限=+3)分别对应着0.135%和99.865%两个百分位数的值,而中心值(Z中心=0)恰巧对应着50%这个百分位数的值。这启发我们在非正态分布的情况下,+/-3倍标准差的界限值以及中心值同样可以用这样的标准百分位数的值替代,只是这些值来源于各种特殊的分布曲线,而不是正态分布曲线。基于这样的原理,可以将公式1.1和1.2修正为公式1.3和1.4。
P0.00135,P0.50和P0.99865分别表示数据在特定的概率分布的条件下,0.135%、50%和99.865%的百分位数。
在本例中,已经确定数据服从对数正态分布,因此可以根据对数正态分布的概率函数分别求出P0.00135,P0.50和P0.99865,然后再代入公式1.3和1.4就可以了。以上的分析思路可以通过JMP软件快速实现如图四所示的结果。注意到此时的Cpk=0.332,与原先的结果相比降低了将近1倍,说明原先高估了过程能力,实际的过程能力还是很低的。
虽然运用“分布拟合法”解决了案例中的问题,但是在实际应用中,它也有不足之处。第一,有时数据的分布明显不服从正态分布,但也无法找出对应的分布函数;第二,理论上讲,准确计算P0.00135和P0.99865这样的百分位数的值一般需要较大规模的数据记录(如300条以上),而这一点往往远大于我们可能的数据采集量。
三、百分位数法
为了克服这两个缺陷,我们再来介绍“百分位数法”。其实质是一种非参数的方法,是在“分布拟合法”的基础上改进而来,可以满足更普遍的过程能力分析的需求。其主要区别是将两个界限值所对应的0.135%和99.865%的百分位数调整为0.5%和99.5%(这就降低了对数据量的要求),而且具体的计算并不是依据数据所服从的概率分布规律,而是直接根据原始数据计算而得的(这就免去了计算和判断数据分布的麻烦)。因此,公式1.3和1.4被进一步修正为公式1.5和1.6。
X0.00135,X0.50和X0.99865分别表示数据在不服从任何特定分布的条件下,0.5%、50%和99.5%的百分位数。
依据“百分位数法”的原理,通过JMP软件中的自定义公式,同样可以快速地得到第三种过程能力分析方法的结果,如图五所示,Cpk=0.466。该结果处于前两种方法得到的结果之间,基本反映了实际的过程能力。
四、方法总结
总而言之,我们在充分重视在过程能力分析中出现的非正态问题的同时,既不必拘泥于传统的、不恰当的分析方法,也不必过分紧张和惧怕,只要能够正确地运用以上介绍的分布拟合法和百分位数法,就能够“让数据说话”,而且能够“让数据说真话”,真正地发挥过程能力指数在工程技术工作中的实际指导作用。