可靠性工程——成功之路
很多公司都曾經(jīng)發(fā)生了或正在發(fā)生著這樣一種情況,市場上,客戶對產(chǎn)品不斷發(fā)生的故障抱怨不斷,對反復(fù)發(fā)生的問題更是暴跳如雷和無可奈何;而營銷人員在旁如坐針氈,走也不是,不走也不是,恨不得找個人狠狠打一頓。他們往往第一個想到的是為什么生產(chǎn)這樣差,這幫人都是干什么的。 很自然,有問題的產(chǎn)品源源不斷地返回公司,進(jìn)行修理和返工。曾經(jīng)有這樣一家公司,是國內(nèi)著名企業(yè),98年的時候,市場競爭加劇,但質(zhì)量沒有控制好,產(chǎn)品返修率高達(dá)6%,那一年,也不知為什么,產(chǎn)品問題不斷,幾個產(chǎn)品線都有問題,以至臨時存放的倉庫都放不下。此事上報老板,要求老板增加倉庫,老板到倉庫現(xiàn)場一看,十分觸動,密密麻麻,到處都是,果然再不增加倉庫就沒有地方了。老板正在為日益被對手蠶食的市場而寢食難安,更加被眼前的景象刺激。不改變是沒有出路了。 老板經(jīng)過多日苦思冥想,決定全面變革,引進(jìn)國際管理咨詢公司,為公司診斷,下猛藥。同時成立多個改進(jìn)小組,分頭實施。事后證明,該老板是十分英明的。 其中的一個小組,是進(jìn)行失效分析,為什么失效,找到真正原因。 該小組首先從電路原理進(jìn)行分析,找到失效單元,再確認(rèn)失效元件,用各種物理化學(xué)手段,分析元件,找到失效機(jī)理,研究并驗證該元件的失效機(jī)理,是ESD,MSD,EOS還是其他原因?qū)е碌膿p傷,最后根據(jù)元件規(guī)格和現(xiàn)場條件判定該元件是否被可靠地使用,從而找到真正的原因。經(jīng)過大量的分析后,基本所有的元件都被分析到,自然形成了一個失效案例數(shù)據(jù)庫。這樣,每個設(shè)計工程師在使用一個庫里的元件時,都預(yù)先知道了該元件曾經(jīng)的失效經(jīng)歷,從而能夠在設(shè)計時提前考慮,加以預(yù)防。這就是器件級DFMEA。前后經(jīng)過7年的實踐,該公司取得了巨大成就,產(chǎn)品可靠性達(dá)到世界一流水平,遙遙領(lǐng)先于國內(nèi)對手。國際市場則所向披靡,令對手膽寒。 現(xiàn)在我們來看看產(chǎn)品可靠性的全過程是什么樣的。我們可以用一個圖來做一個整體描述:

要設(shè)計生產(chǎn)出可靠的產(chǎn)品,需要從整個流程考慮問題。方案選型是第一步,也是最重要的一步。往往我們都會栽在這一步。產(chǎn)品可靠性的50%是由元件本身的可靠性決定的,30%是設(shè)計過程決定的,20%是制造、運(yùn)輸和使用決定的,當(dāng)選型不慎,使用了不成熟的方案和器件,設(shè)計和生產(chǎn)再努力,也是沒有用。在競爭日益激烈,價格戰(zhàn)不斷的消費(fèi)電器領(lǐng)域,很多公司經(jīng)不住短期的困難,往往冒險使用供應(yīng)商新推出的更低成本方案,短時間內(nèi),產(chǎn)品很快占領(lǐng)市場,也贏得一些利潤,殊不知,危機(jī)已經(jīng)潛伏下來。常見的現(xiàn)象就是,剛開始轟轟烈烈,皆大歡喜,沒多久,也就2-3個月,大量的產(chǎn)品開始出現(xiàn)這樣那樣的故障,售后部門像無頭蒼蠅,到處滅火,設(shè)計人員被各種求救電話折騰得沒有脾氣,極大地消耗了各方士氣,剛到手的微薄利潤也在無聲無息中悄悄流失。而事情并沒有到此為止,連綿不斷的返修、投訴,導(dǎo)致顧客怨聲載道,罵聲一片,最后連累該公司的所有產(chǎn)品,銷量下滑,利潤下滑,顧客流失,老板心急如焚,但也沒有辦法。 如果就此能夠吸取教訓(xùn),從此嚴(yán)肅對待此事,未必不是一件好事,但事實上,“好了傷疤忘了疼”是常見現(xiàn)象。過不了多久,又回到老路上,繼續(xù)重復(fù)著,產(chǎn)品始終在低水平上運(yùn)行,問題不斷重復(fù),市場越來越小。 這里有一個數(shù)據(jù):方案(器件)選型,IBM需要1-2年時間,才能決定是否使用,一旦確定,必簽定嚴(yán)格苛刻的質(zhì)量協(xié)議,如有違反,將遭到最多10倍損失的罰款。本文開頭提到的公司原來是2-4周時間來認(rèn)證,最后經(jīng)過改進(jìn),3-6個月。選型的重要性已經(jīng)被國際公司證明是嚴(yán)肅和關(guān)鍵的。 提高產(chǎn)品可靠性接下來就是設(shè)計過程。這個過程就是可靠地使用元件的過程。要想真正可靠設(shè)計,并用好辛辛苦苦選定的元件,設(shè)計人員應(yīng)當(dāng)掌握14門設(shè)計課程:可靠性預(yù)計,F(xiàn)MEA,QFD,EOS防護(hù)設(shè)計,ESD防護(hù)設(shè)計,容差設(shè)計,降額設(shè)計,升額設(shè)計,熱設(shè)計,信號完整性分析,EMC設(shè)計,安全設(shè)計,環(huán)境適應(yīng)性設(shè)計,壽命與可維護(hù)性設(shè)計。 其中最重要的幾門課程是:FMEA,QFD,EOS防護(hù)設(shè)計,ESD防護(hù)設(shè)計,容差設(shè)計,降額設(shè)計,信號完整性分析和EMC,安全設(shè)計。這些設(shè)計課程的知識最終要轉(zhuǎn)化到產(chǎn)品當(dāng)中,沒有這些知識積累,要設(shè)計出可靠的產(chǎn)品基本上是靠反復(fù)測試修改,人海戰(zhàn)術(shù)再加上好運(yùn)氣了。 當(dāng)然這些課程是要靠積累獲得的,請外部專家是一個捷徑。 設(shè)計完成后,接下來就是生產(chǎn)制造,影響制造可靠性的關(guān)鍵環(huán)節(jié)就是ESD防護(hù)、MSD防護(hù)以及可焊性問題。ESD不僅在生產(chǎn)線上要注意防護(hù),在倉儲、配送各個環(huán)節(jié)都要注意。MSD是潮濕敏感度的簡稱,一般IC都是特種塑料封裝,由注塑機(jī)一次成型,其優(yōu)點是適合大批量生產(chǎn),缺點就是氣密性差,容易吸收空氣中水分。吸收水分的IC在回流焊或波峰焊時,表面的高溫會引起水分在極短時間內(nèi)汽化,引起封裝材料應(yīng)力集中而膨脹變形,變形的封裝材料導(dǎo)致IC內(nèi)引線受力,引起脫焊或虛焊,有的即使沒斷,但也變形變細(xì),以后在正常使用中,也可能會燒斷,嚴(yán)重影響產(chǎn)品可靠性。為了克服MSD的問題,最好是選用MSD等級高的產(chǎn)品,MSD3級的產(chǎn)品,能夠使得IC暴露在空氣中1周時間而不需要在焊接時進(jìn)行預(yù)處理。而MSD5級的產(chǎn)品,暴露在空氣中則僅僅能放置24h,超過24h,必須進(jìn)行烘烤干燥處理。 可焊性是另一個影響產(chǎn)品可靠性的關(guān)鍵因素,常見的現(xiàn)象是產(chǎn)品在1年左右的使用后,就出現(xiàn)時而正常,時而不正?,F(xiàn)象,打開機(jī)殼后,并沒有元件燒損,仔細(xì)檢查,往往會發(fā)現(xiàn)是可疑元件管腳虛焊,重新補(bǔ)焊后,一切正常。有統(tǒng)計數(shù)據(jù)表明,CRT電視此類現(xiàn)象占所有返修故障的20%多,是第一位的失效原因。 要提高可焊性首先要元件引腳可焊性提高,經(jīng)常發(fā)現(xiàn)有的元件引腳十分光亮,有的是暗淡無光,有的是銀色,有的是灰色,有的表面光滑,有的粗糙,有的粗,有的細(xì),這些不同材質(zhì),不同大小的元件在一起,焊接的質(zhì)量可想而知了。但這種情況往往得不到應(yīng)有的重視,一旦發(fā)生問題,首先認(rèn)為是生產(chǎn)的問題,其實問題早就發(fā)生了,為什么不要求供應(yīng)商注意呢,但無人關(guān)注。尤其是無鉛焊接實施后,引腳材料和焊接工藝都發(fā)生了變化,可焊性條件需要特別關(guān)注。 失效分析,這一步就是針對設(shè)計、生產(chǎn)、售后發(fā)生的元件失效進(jìn)行地毯式檢查分析,使用各種儀器設(shè)備進(jìn)行檢查,透過現(xiàn)象,根據(jù)失效機(jī)理,找到失效的真正原因。是設(shè)計造成的、生產(chǎn)造成的,還是元件本身質(zhì)量問題,然后改進(jìn)提高。這個過程需要具有豐富設(shè)計經(jīng)驗的工程師主導(dǎo)。常見現(xiàn)象是,采購人員拿到供應(yīng)商處進(jìn)行分析,但結(jié)論往往都是使用問題,或是敷衍了事,或是不了了之,總之,不是廠家的問題?;蛟S他會悄悄改正,但你不可能得到什么有價值的結(jié)果,更無法向他索賠。所有人員都蒙在鼓里,沒有積累,沒有長進(jìn)。大多數(shù)廠家對失效分析的關(guān)注程度很不夠,都認(rèn)為,只要問題解決了,一切都OK了。其實,這里面的經(jīng)驗教訓(xùn),很多是用多少錢也換不來的,浪費(fèi)掉,實在可惜。 以上過程是一個產(chǎn)品可靠性的過程。這個過程是一個閉環(huán),是一個穩(wěn)定的質(zhì)量改進(jìn)過程。做好了每個環(huán)節(jié),可靠性必將是有很高的保證。 如何做好這個閉環(huán),使得各項工作都有成效呢?這就需要流程保障,IT手段。 流程保障的目的就是不同的人做相同的事,保證有相同或相近的結(jié)果,即使錯了,也錯得一致。流程保障的重點就是做好各個過程關(guān)鍵點的管理和控制,嚴(yán)格輸入輸出的控制。常見的現(xiàn)象就是說得好好的,寫在紙面上,但一旦實施,就是困難重重,這個理由那個原因,總之,不想改變,結(jié)果往往是剛開始轟轟烈烈,最后卻原地踏步。原因有多種,一個最主要的原因是沒有使用IT技術(shù),實際操作中,由于需要大量的文檔輸出,光靠個人手工,沒有資源共享,管理部門面對海量的信息,怎么能夠應(yīng)付過來?由于缺少及時檢查督促,工程人員往往由于惰性,而最后放棄變化。另外,工作業(yè)績統(tǒng)計也是需要IT手段,如果能自動生成各種報表,減輕大家的負(fù)擔(dān),流程就更容易貫徹下去?,F(xiàn)在比較流行的就是PDM,ERP。 另一個重要原因就是制度缺乏剛性,害怕工程人員反對,好象工程人員不高興,制度就是錯的。因此,往往制度就是在看臉色中變形而流產(chǎn)的。本文開頭提到的公司剛開始實施DFMEA過程中,也有很多工程師不適應(yīng),從研發(fā)走了很多人,去技術(shù)支持的,去銷售的,這些人在新崗位上都發(fā)揮了很大作用。留下來的,后來補(bǔ)充進(jìn)來的,都嚴(yán)格按規(guī)定操作,結(jié)果,實施不到幾年,PCB升級次數(shù)由5.8降到3.2;產(chǎn)品的返修率從6%降到0.5%。以至后來該公司一線研發(fā)人員招聘條件都比以前低,薪水也降了很多。理由是嚴(yán)格按流程做,不需要多么高的知識水平就同樣能保證高質(zhì)量的水準(zhǔn)。這個有點像印度的軟件工程師,由于印度的軟件質(zhì)量保證工程(CMM)做得非常好,以至家庭婦女都能寫上一段標(biāo)準(zhǔn)的代碼,完成一個特定的功能。 現(xiàn)在,很多公司在遇到困難時,首先想到的是降低成本、降薪、裁人,但沒有想到裁人后怎么辦?如果立即行動,建立系統(tǒng)的制度,輔以IT手段,加強(qiáng)內(nèi)功,以圖東山再起,無疑是壞事變好事??赏桥艛D了異己,引進(jìn)了知己。這樣的企業(yè),時常處在一種動蕩當(dāng)中,3個月一小變,6個月一大變,員工茫茫然,領(lǐng)導(dǎo)也是茫茫然。本文開頭提到的公司給我們做了一個榜樣,98年在公司面臨嚴(yán)重危機(jī)的關(guān)鍵時刻,下屬一家公司以7.5億美元出售。從上到下,從左到右,各自請業(yè)內(nèi)最好的顧問,強(qiáng)力實施學(xué)習(xí)和變革,前后總共花掉10億咨詢費(fèi)。現(xiàn)在,該公司已經(jīng)成功度過冬天,并迎來果實累累的季節(jié)。 作者單位 TTE全球研發(fā)中心
|