AI人工智能 分類器的性能

2020-09-23 15:38 更新

在實現(xiàn)機器學(xué)習(xí)算法之后,我們需要找出模型的有效性。 衡量有效性的標準可以基于數(shù)據(jù)集和度量標準。 為了評估不同的機器學(xué)習(xí)算法,我們可以使用不同的性能指標。 例如,假設(shè)使用分類器來區(qū)分不同對象的圖像,可以使用分類性能指標,如平均準確率,AUC 等。從某種意義上說,我們選擇評估機器學(xué)習(xí)模型的指標是非常重要的,因為指標的選擇會影響機器學(xué)習(xí)算法的性能如何被測量和比較。 以下是一些指標 -

混亂矩陣

基本上它用于輸出可以是兩種或更多種類的分類問題。 這是衡量分類器性能的最簡單方法。 混淆矩陣基本上是一個包含兩個維度即“實際”和“預(yù)測”的表格。 這兩個維度都有“真正的正面(TP)”,“真正的負面(TN)”,“錯誤的正面(FP)”,“錯誤的否定(FN)”。

img

在上面的混淆矩陣中,1表示正類,0表示負類。 以下是與混淆矩陣相關(guān)的術(shù)語 -

  • 真正 - 當(dāng)實際的數(shù)據(jù)點類別為 1 并且預(yù)測也為 1 時,TP 就是這種情況。
  • 真負 - 當(dāng)數(shù)據(jù)點的實際類別為 0 并且預(yù)測也為 0 時,TN 就是這種情況。
  • 假正 - 當(dāng)實際的數(shù)據(jù)點類別為 0 并且預(yù)測也為 1 時,F(xiàn)P 就是這種情況。
  • 假負 - FN 是數(shù)據(jù)點的實際類別為 1 且預(yù)測也為 0的情況。

準確性

混淆矩陣本身并不是一個性能指標,但幾乎所有的性能矩陣均基于混淆矩陣。 其中之一是準確性。 在分類問題中,它可能被定義為由模型對各種預(yù)測所做的正確預(yù)測的數(shù)量。 計算準確度的公式如下 - img

精確 它主要用于文件檢索。 它可能被定義為返回的文件有多少是正確的。 以下是計算精度的公式 - img

召回或靈敏度 它可能被定義為模型返回的正數(shù)有多少。 以下是計算模型召回/靈敏度的公式 -

img

特異性 它可以定義為模型返回的負數(shù)有多少。 這與召回完全相反。 以下是計算模型特異性的公式 -

img

以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號