來源:互聯網
查全率與查準率是信息檢索領域的兩個重要指標,用于評估檢索系統的性能。這兩個指標可以用來繪制PR曲線,通過此曲線可以直觀地比較不同系統的優劣。查全率和查準率之間存在著相互制約的關系,在某些極端情況下,一個系統可能會擁有極高的查全率或查準率,但在另一方面則表現不佳。
查準率
查準率,也稱為精度,是指檢索出的相關文獻量占檢索出的所有文獻量的比例。其計算公式為:查準率 = (檢索出的相關信息量 / 檢索出的信息總量)× 100%。使用專指性較強的檢索語言,如上位類、上位主題詞等,能夠提高查準率,但同時會降低查全率。
查全率
查全率,又稱召回率,衡量的是檢索系統從文獻集合中檢出相關文獻的成功程度。它等于檢索出的相關文獻量除以系統中所有相關文獻量的百分比,即查全率 = (檢索出的相關信息量 / 系統中的相關信息總量)× 100%。使用泛指性較強的檢索語言,同樣能夠提升查全率,但查準率會相應下降。
應用實例
在殺毒軟件評測中,查全率與查準率也是重要的評估標準。評測通常由專業的論壇或國際機構進行,他們會在新電腦系統中植入一定數量的QQ惡龍樣本,隨后安裝待測的殺毒軟件。通過分析查殺結果,評估軟件能否全數檢出病毒并準確清除,同時避免誤殺正常軟件。具備豐富病毒庫或智能分析引擎的殺毒軟件往往能在查殺速度和準確性上有更出色的表現。
參考資料 >
【分類問題中模型的性能度量(一)】錯誤率、精度、查準率、查全率、F1詳細講解.博客園.2024-10-26
機器學習--查準率和查全率.CSDN.2024-10-26
查全率與查準率的計算方法.CSDN博客.2024-10-26