自動表面檢測分類器的調(diào)整
點擊下方卡片,關(guān)注“新機器視覺”公眾號
視覺/圖像重磅干貨,第一時間送達
1 前言
隨著計算機硬件和軟件的不斷進步,自動表面檢測系統(tǒng)(ASIS)已廣泛應(yīng)用在許多扁鋼工藝,包括熱軋、酸洗、鍍錫、熱鍍鋅(HDG)等表面質(zhì)量控制和質(zhì)量保證。然而,這些商業(yè)系統(tǒng)在圖像數(shù)據(jù)處理、模式識別算法和軟件圖形用戶界面(GUI)方面差別非常大。
AM/NS Calvert公司在2008年安裝了ISRA Parsytec ASIS。本文主要介紹了為提升ASIS分類性能所做的ASIS分類器調(diào)整工作。首先對AM/NS Calvert #3HDGL(熱鍍鋅線)的Parsytec ASIS配置做了總概述,然后展示了決策樹型調(diào)試方法,以Calvert #3HDGL亮面鍍鋅(GI-BF)材料為例,介紹了使用分類器調(diào)試器的目標和程序。
2 分類器調(diào)試方法和規(guī)程
2.1AM/NS Calvert #3HDGL的ASIS配置
ASIS是基于攝像機的視覺系統(tǒng),能在帶鋼運行時進行表面缺陷在線檢測、定位和分類。該系統(tǒng)安裝在Calvert #3HDGL的涂層線的末端,然后再安裝側(cè)邊修邊機。它由每側(cè)的亮面和暗面視覺組成,每個視角有兩個4K行掃描攝像機。這條線的最大運行速度是260m/min。這樣形成了0.25 mm × 0.5 mm/像素的圖像分辨率。
2.2分類器調(diào)試方法
一種通用的ASIS調(diào)試和性能優(yōu)化方法,如圖1所示。它包括缺陷檢測調(diào)試和分類調(diào)試任務(wù)。這兩個任務(wù)都需要指定系統(tǒng)的業(yè)務(wù)目標。系統(tǒng)使用的業(yè)務(wù)目標會指導系統(tǒng)如何與工藝信息共同配置和調(diào)試。經(jīng)初步調(diào)整后,系統(tǒng)性能可以通過線圈檢查圖和用戶反饋來評估。然后將信息輸入系統(tǒng)進行微調(diào),指導系統(tǒng)性能達到最佳狀態(tài)。調(diào)試鏈條是一個閉環(huán),通常需要兩到三個循環(huán)。為了達到最佳系統(tǒng)性能,需要兩方面的知識,一是質(zhì)量和工藝方面的知識,另一個是ASIS調(diào)試方面的知識。

Calvert #3HDGL一直是生產(chǎn)汽車和一些工業(yè)非汽車產(chǎn)品的鍍鋅(GI)和鍍層退火(GA)材料。系統(tǒng)主要用做與表面缺陷和工藝故障排除相關(guān)的質(zhì)量保證輔助工具。調(diào)試過程中,作者咨詢了精整線質(zhì)量專家及生產(chǎn)線檢測人員,收集系統(tǒng)使用要求,得到每日退卷報告,起草含工藝參數(shù)的生產(chǎn)清單,接收系統(tǒng)使用反饋等。這是調(diào)試系統(tǒng)獲得最佳性能最關(guān)鍵的任務(wù)。
2.3分類器調(diào)試目標和程序
對某缺陷的分類性能用兩個參數(shù)評估:準確率和置信度。準確率定義了分類器正確分類缺陷的百分比。置信率定義了某缺陷分類樣本中真實樣本數(shù)的百分比。為滿足系統(tǒng)使用的業(yè)務(wù)需求,分類調(diào)試目標是調(diào)試分類器,使其能更精確分類真實的總體的和重要的缺陷(有更高的準確率)并減少誤報缺陷(盡可能高的分類置信度)。相比錯誤分類重要缺陷,總體缺陷和真實缺陷之間的混淆,包括重要的和次要的缺陷,更易被接受。
分類器優(yōu)化過程包括構(gòu)建缺陷庫、選擇缺陷特征、設(shè)置決策樹參數(shù)并創(chuàng)建分類器模型及評估分類器性能和分類器微調(diào)(見圖2)。根據(jù)分類器測試結(jié)果,滿足分類器調(diào)試目標,進一步改進分類器可以通過豐富缺陷庫、選擇最優(yōu)特征集和/或設(shè)置不同分類器參數(shù)來實現(xiàn)。整個過程將重復多次,直到達到滿意的分類結(jié)果。

2.4構(gòu)建缺陷庫
創(chuàng)建一個好的分類器最重要的步驟之一是構(gòu)建一個缺陷庫,它可以代表正常生產(chǎn)環(huán)境下重要的表面缺陷和偽缺陷。構(gòu)建缺陷庫時,已基于之前的研究和經(jīng)驗制定了最佳實踐。這些最佳實踐是:1)將類似的缺陷歸為一類;2)盡量限制總類別(10-15更好,但20-30也不錯);3)每種缺陷類別獲得大致相等的樣本數(shù),且最大與最小組/類的比例不超過5比1;4)盡量使每一類缺陷具有相似的外觀多樣性,避免在同一類中收集相同的缺陷圖像,也要避免在兩個不同類別中從一個類別中收集相同或相似的缺陷圖像;5)盡量不按照缺陷的嚴重程度歸類;6)不收集特征值無法計算的缺陷圖像;7)不收集有預(yù)先規(guī)則分類器分類的缺陷;8)不將非正常工藝中收集的圖像歸入缺陷庫。
ISRA Parsytec系統(tǒng)包含可供用戶輕松完成整個分類器調(diào)優(yōu)過程的軟件(見圖2) 。它具有多重功能,可以簡化分類器創(chuàng)建過程,使用戶界面對多個鋼卷中某些確定缺陷實現(xiàn)快速圖像收集。它也提供了相似性功能,幫助收集特定圖像,并提供了用戶友好界面,有助于用戶將缺陷圖像快速分類。此外,通過該軟件可以更方便地獲取和設(shè)置分類器參數(shù)。
基于Calvert系統(tǒng)的配置和系統(tǒng)設(shè)置,建立了四個缺陷庫:GI-BF、GI暗面(GI-DF)、GA亮面(GA-BF)、GA暗面(GA-DF)。缺陷庫的統(tǒng)計數(shù)據(jù)如表1所示。

2.5選擇缺陷特性
構(gòu)建分類器的第二步是選擇缺陷特征。ISRA Parsytec系統(tǒng)提供多于800個缺陷特征。有趣的是,大量的特征是否會引發(fā)分類器過擬合?這意味著對未預(yù)見/新的缺陷圖像數(shù)據(jù)泛化能力較差。本研究旨在驗證是否決策樹分類器特征數(shù)需要減少。特征數(shù)減少含兩部分:特征選擇和特征提取。特征選擇試圖找到變量原始集的子集或特征,來獲得更小的子集,可用于建模問題。它涉及三種方式,即篩選、包裝或嵌入。特征提取將高維空間中的數(shù)據(jù)降低為低維空間。降維方法有主成分分析(PCA)、線性判別分析(LDA)和廣義判別分析(GDA)。本節(jié)研究了基于PCA特征的降維算法及其對最終分類器性能的影響。
PCA基于投影的方法,通過將數(shù)據(jù)投影到一組正交軸上實現(xiàn)數(shù)據(jù)轉(zhuǎn)換。它找到了原始變量的最佳線性組合,使方差或沿新變量的分布得到優(yōu)化。本研究中使用了最初改進的GI-BF缺陷庫。利用ISRA Parsytec ASIS軟件提取缺陷庫的缺陷特征。這些特征被輸入到Python開發(fā)環(huán)境下的PCA函數(shù)。選用了最佳的274個方差等于或大于99%的部件/特征做分類器性能測試。為了比較前274個特征數(shù)與原始分類器的有效性,使用相同的GI-BF缺陷庫創(chuàng)建了具有274個特征的分類器。表2和表3分別顯示了使用新檢測圖像數(shù)據(jù)(四個半暴露的GI-BF鋼卷共914個缺陷)的兩個分類器測試結(jié)果。此外注意到,使用超過800個特征的分類器訓練時間比使用274個特征的分類器時間長5倍。結(jié)果表明,采用基于PCA特征降維算法的分類器與采用完整特征集的分類器性能相似,還可以預(yù)計到,分類新的缺陷需要的時間更少。如果系統(tǒng)配置參數(shù)具有更高的檢測靈敏度,可以實時處理大量數(shù)據(jù),這將非常有用。


2.6設(shè)置分類器參數(shù)并構(gòu)建分類器
分類器調(diào)試的第三步是配置分類器參數(shù)并創(chuàng)建分類器模型。ISRA Parsytec系統(tǒng)提供了一種決策樹分類器算法,它應(yīng)用了修剪技術(shù)和boosting算法以獲得良好的分類器泛化能力。Boosting參數(shù)是并發(fā)分類器的總數(shù),默認值是10。用戶能輸入的最大值是12。選擇的數(shù)值越大,處理時間越長,分類器泛化能力就越強。這個例子中,數(shù)值為12。有兩個修剪參數(shù):修剪前和修剪后。這兩個參數(shù)用的是默認值。“投票參數(shù)”在單決策樹分類器流程中應(yīng)用。較小數(shù)量的投票參數(shù)可以減少未分類缺陷。“置信度”參數(shù)應(yīng)用于不同的并發(fā)分類器。較小這個值還可以減少未分類缺陷。在缺陷樣本不足的初始分類器調(diào)優(yōu)階段,這兩個參數(shù)設(shè)置為默認值0.6。缺陷庫充分開發(fā)后,這兩個參數(shù)可以減小到0.35,從而減少未分類缺陷總數(shù)。
設(shè)置好分類器參數(shù)后,就可以自動訓練分類器。但是第一個分類器通常不會上線,需要進一步的微調(diào)。
2.7分類性能評估和分類器微調(diào)
分類器微調(diào)是一個重復的過程(見圖2)。第一個分類器創(chuàng)建后,可以針對訓練缺陷庫對其進行測試。分類器性能的混淆矩陣可以用來指導缺陷庫的細化。列舉混淆矩陣的一個例子,C/T表示分配的類別(由專家分類)相對于分類器分的類別。利用第一類分類器的分類結(jié)果,可以在嚴重缺陷和重要缺陷之間檢查不確定缺陷,并將外觀類似的缺陷歸為一類;通過觀察未分類缺陷的外觀檢查,可以檢查同一類缺陷中是否有重復樣本,以及缺陷分類中代表性缺陷是否較少。驗證過程旨在為改進的分類器進一步提高缺陷庫質(zhì)量。如此,分類器微調(diào)需要幾個循環(huán)周期,并在在線系統(tǒng)中使用。
分類器及其缺陷庫離線微調(diào)后,如果分類器結(jié)果令人滿意,可以將其升級到在線系統(tǒng)中。通過收集未分類和分類錯誤的重要缺陷,并將他們重新分類到缺陷庫中,可能需要更多的循環(huán)進一步提高分類器性能。
3 結(jié)論和討論
本文提出了一種基于決策樹的分類器優(yōu)化方法和步驟,包括缺點庫構(gòu)建最佳實踐、特征選擇、分類器參數(shù)設(shè)置和分類器性能評估及其微調(diào)。以在Calvert#3HDGL使用GI-BF分類器構(gòu)建過程為例,它強調(diào)了缺陷庫構(gòu)建的最佳實踐。在特征選擇過程中,研究了基于PCA的特征降維方法及其對最終分類器性能的影響。可以得出結(jié)論,與使用整個特征集相比,降維特征集(274個特征)可以在減少分類器訓練速度和可能降低在線分類器執(zhí)行速度的情況下實現(xiàn)類似的分類器性能。
雖然建立一個具有代表性的缺陷庫是一項繁瑣且耗時的工作,但該領(lǐng)域未來的研究課題可能是開發(fā)創(chuàng)建具有代表性偽缺陷圖像的方法和算法、缺陷自動分類以及分類器更高的泛化能力。(史峰鷹)
本文摘選自本報2021年第20期B16部分內(nèi)容,若要詳細了解更多相關(guān)行業(yè)和技術(shù)信息,請關(guān)注本報紙質(zhì)報紙每期A版和B版內(nèi)容,或者登陸本報手機APP客戶端,或者本報網(wǎng)站新址:http://www.worldmetals.com.cn/電子報閱讀全文。轉(zhuǎn)載請注明出處。
—版權(quán)聲明—
僅用于學術(shù)分享,版權(quán)屬于原作者。
若有侵權(quán),請聯(lián)系微信號:yiyang-sy 刪除或修改!
