2.3.4 代價(jià)敏感錯(cuò)誤率與代價(jià)曲線
在現(xiàn)實(shí)任務(wù)中常會(huì)遇到這樣的情況:不同類型的錯(cuò)誤所造成的后果不同.例如在醫(yī)療診斷中,錯(cuò)誤地把患者診斷為健康人與錯(cuò)誤地把健康人診斷為患者,看起來(lái)都是犯了“一次錯(cuò)誤”,但后者的影響是增加了進(jìn)一步檢查的麻煩,前者的后果卻可能是喪失了拯救生命的最佳時(shí)機(jī);再如,門禁系統(tǒng)錯(cuò)誤地把可通行人員攔在門外,將使得用戶體驗(yàn)不佳,但錯(cuò)誤地把陌生人放進(jìn)門內(nèi),則會(huì)造成嚴(yán)重的安全事故.為權(quán)衡不同類型錯(cuò)誤所造成的不同損失,可為錯(cuò)誤賦予“非均等代價(jià)”(unequal cost).
以二分類任務(wù)為例,我們可根據(jù)任務(wù)的領(lǐng)域知識(shí)設(shè)定一個(gè)“代價(jià)矩陣”(cost matrix),如表2.2所示,其中costij表示將第i類樣本預(yù)測(cè)為第歹類樣本的代價(jià),一般來(lái)說(shuō),costii=0;若將第0類判別為第1類所造成的損失更大,則costoi>costio;損失程度相差越大,costoi與costio值的差別越大.