來源:互聯網
孤立點(Outlier)是指不符合數據的一般模型的數據。在挖掘正常類知識時,通常總是把它們作為噪聲來處理。當人們發現這些數據可以為某類應用(如信用欺詐、入侵檢測)等提供有用信意時,就為數據挖掘提供了一個新的研究課題,即孤立點分析。發現和檢測孤立點的方法已被廣泛討論,主要有基于概率統計、基于距離和基于偏差等檢測技術的類方法1994年,Bamett等建立了基于統計方法的孤立點檢測概念。基于國離的孤立點檢測方法被Knorr和Ng等在一系列文章中詳細描述。現于偏差的孤立點檢測技術可以參考Aming和Agrawal等研究。目前孤立點分析作為信用卡欺詐、網絡非法入侵等安全檢測手段成為很有應用價值的研究分支。
數學含義
孤立點也可以指是在數據集合中與大多數數據的特征或不一致的數據。
此外,在離散數學的圖論中孤立點的定義是無邊關聯的點。
設A是中的一個點集,點 ,若,但a不屬于A的導集,則稱a為A的孤立點。
IT含義
在IBM的操作系統中,孤立點(enclave)表示的是業務處理或者工作單元。每個孤立點在地址空間中都是活動的,被分配了唯一的派遣和輸入輸出優先級,這是由用戶分配給孤立點的目的決定的。工作量管理器就會基于它的優先級分配資源給每個孤立點enclave。如果一些處理是并發共享同一個地址空間,那么最不重要的處理就會被剝奪需要的資源,知道更重要的處理完畢。
事物管理器,如分布式據工具(DDF)、存儲過程服務器以及MQSeries的工作流都使用孤立點。
參考資料 >