SPSS(Statistical Package for the Social Sciences),即“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”。SPSS Clementine是IBM公司推出的統(tǒng)計(jì)分析軟件,基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理。
SPSS是世界上最早的統(tǒng)計(jì)分析軟件,由美國(guó)斯坦福大學(xué)的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull和Dale H. Bent于1968年研究開(kāi)發(fā)成功,SPSS最初只能運(yùn)行在大學(xué)或機(jī)構(gòu)內(nèi)的大型計(jì)算機(jī)上,同時(shí)成立了SPSS公司,并于1975年成立法人組織,在芝加哥組建了SPSS總部。1984年,SPSS公司首先推出世界上第一個(gè)可以在DOS上運(yùn)行的統(tǒng)計(jì)分析軟件的PC版本,即SPSS/PC+版。SPSS統(tǒng)計(jì)分析過(guò)程包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、對(duì)數(shù)線性模型、聚類分析等幾大類。
SPSS Clementine操作簡(jiǎn)便、編程方便、功能強(qiáng)大且分析結(jié)果清晰、直觀,能夠讀取及輸出多種格式的文件。比如由dBASE、Visual FoxPro、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS數(shù)據(jù)文件。SPSS應(yīng)用領(lǐng)域廣泛,在通信、醫(yī)療、銀行、科研教育等眾多領(lǐng)域和行業(yè)都有所涉及。
發(fā)展沿革
SPSS是世界上最早的統(tǒng)計(jì)分析軟件,由美國(guó)斯坦福大學(xué)的三位研究生Norman H.Nie、C.Hadlai(Tex) Hull 和 Dale H.Bent于1968年研究開(kāi)發(fā)成功,SPSS最初只能運(yùn)行在大學(xué)或機(jī)構(gòu)內(nèi)的大型計(jì)算機(jī)上。1975年,SPSS公司成立,總部設(shè)在芝加哥。
2009年7月28日,IBM公司宣布將用12億美元現(xiàn)金收購(gòu)統(tǒng)計(jì)分析軟件提供商SPSS公司。如今SPSS的最新版本為25,而且更名為IBM SPSS Statistics。迄今,SPSS公司已有40余年的成長(zhǎng)歷史。
主要功能
SPSS是世界上最早采用圖形菜單驅(qū)動(dòng)界面的統(tǒng)計(jì)軟件,它最突出的特點(diǎn)就是操作界面極為友好,輸出結(jié)果美觀漂亮。它將幾乎所有的功能都以統(tǒng)一、規(guī)范的界面展現(xiàn)出來(lái),使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)方法的功能,對(duì)話框展示出各種功能選擇項(xiàng)。用戶只要掌握一定的Windows操作技能,精通統(tǒng)計(jì)分析原理,就可以使用該軟件為特定的科研工作服務(wù)。SPSS Clementine采用類似EXCEL表格的方式輸入與管理數(shù)據(jù),數(shù)據(jù)接口較為通用,能方便的從其他數(shù)據(jù)庫(kù)中讀入數(shù)據(jù)。其統(tǒng)計(jì)過(guò)程包括了常用的、較為成熟的統(tǒng)計(jì)過(guò)程,完全可以滿足非統(tǒng)計(jì)專業(yè)人士的工作需要。輸出結(jié)果十分美觀,存儲(chǔ)時(shí)則是專用的SPO格式,可以轉(zhuǎn)存為HTML格式和文本格式。對(duì)于熟悉老版本編程運(yùn)行方式的用戶,SPSS還特別設(shè)計(jì)了語(yǔ)法生成窗口,用戶只需在菜單中選好各個(gè)選項(xiàng),然后按“粘貼”按鈕就可以自動(dòng)生成標(biāo)準(zhǔn)的SPSS程序。極大的方便了中、高級(jí)用戶。
SPSS for Windows是一個(gè)組合式軟件包,它集數(shù)據(jù)錄入、整理、分析功能于一身。用戶可以根據(jù)實(shí)際需要和計(jì)算機(jī)的功能選擇模塊,以降低對(duì)系統(tǒng)HDD容量的要求,有利于該軟件的推廣應(yīng)用。SPSS的基本功能涵蓋數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等。其中,數(shù)據(jù)管理支持?jǐn)?shù)據(jù)預(yù)處理(包括缺失值處理、異常值檢測(cè)、變量轉(zhuǎn)換等);統(tǒng)計(jì)分析覆蓋推斷性統(tǒng)計(jì)(如t檢驗(yàn)、方差分析、卡方檢驗(yàn)、非參數(shù)檢驗(yàn)等),可輔助用戶完成數(shù)據(jù)清洗與理解。SPSS統(tǒng)計(jì)分析過(guò)程包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、對(duì)數(shù)線性模型、聚類分析、數(shù)據(jù)簡(jiǎn)化、生存分析、時(shí)間序列分析、多重響應(yīng)等幾大類,每類中又分好幾個(gè)統(tǒng)計(jì)過(guò)程,比如回歸分析中又分線性回歸分析、曲線估計(jì)、Logistic回歸、Probit回歸、加權(quán)估計(jì)、兩階段最小二乘法、非線性回歸等多個(gè)統(tǒng)計(jì)過(guò)程,而且每個(gè)過(guò)程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據(jù)數(shù)據(jù)繪制各種圖形。
SPSS for Windows的分析結(jié)果清晰、直觀、易學(xué)易用,而且可以直接讀取EXCEL及DBF數(shù)據(jù)文件,現(xiàn)已推廣到多種各種操作系統(tǒng)的計(jì)算機(jī)上,它和SAS、BMDP并稱為國(guó)際上最有影響的三大統(tǒng)計(jì)軟件。在國(guó)際學(xué)術(shù)界有條不成文的規(guī)定,即在國(guó)際學(xué)術(shù)交流中,凡是用SPSS軟件完成的計(jì)算和統(tǒng)計(jì)分析,可以不必說(shuō)明算法,由此可見(jiàn)其影響之大和信譽(yù)之高。
SPSS for Windows由于其操作簡(jiǎn)單,已經(jīng)在我國(guó)的社會(huì)科學(xué)、自然科學(xué)的各個(gè)領(lǐng)域發(fā)揮了巨大作用。該軟件還可以應(yīng)用于經(jīng)濟(jì)學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物流管理、生物學(xué)、心理學(xué)、地理學(xué)、醫(yī)療衛(wèi)生、體育、農(nóng)業(yè)、林業(yè)、商業(yè)等各個(gè)領(lǐng)域。
發(fā)展歷史
1968年:斯坦福大學(xué)三位學(xué)生創(chuàng)建了SPSS
1968年:誕生第一個(gè)用于大型機(jī)的統(tǒng)計(jì)軟件
1975年:在芝加哥成立SPSS總部
1984年:推出用于個(gè)人電腦的SPSS/PC+
1992年:推出Windows版本,同時(shí)全球自SPSS 11.0起,SPSS全稱為“Statistical Product and Service Solutions”,即“統(tǒng)計(jì)產(chǎn)品和服務(wù)解決方案”
2009年:SPSS公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為預(yù)測(cè)統(tǒng)計(jì)分析軟件(Predictive Analytics 軟件)PASW,包括四部分:
PASW 統(tǒng)計(jì)學(xué)(formerly SPSS Statistics):統(tǒng)計(jì)分析
PASW Modeler(formerly Clementine) :數(shù)據(jù)挖掘
數(shù)據(jù) Collection family(formerly Dimensions):數(shù)據(jù)收集
PASW Collaboration and Deployment Services(formerly Predictive Enterprise Services):企業(yè)應(yīng)用服務(wù)
2010年:隨著SPSS公司被IBM公司并購(gòu),各子產(chǎn)品家族名稱前面不再以PASW為名,修改為統(tǒng)一加上IBM SPSS字樣。
數(shù)據(jù)管理
在10版以后,SPSS的每個(gè)新增版本都會(huì)對(duì)數(shù)據(jù)管理功能作一些改進(jìn),以使用戶的使用更為方便。13版中的改進(jìn)可能主要有以下幾個(gè)方面:
1)超長(zhǎng)變量名:在12版中,變量名已經(jīng)最多可以為64個(gè)字符長(zhǎng)度,13版中可能還要大大放寬這一限制,以達(dá)到對(duì)當(dāng)今各種復(fù)雜數(shù)據(jù)倉(cāng)庫(kù)更好的兼容性。
2)改進(jìn)的Autorecode過(guò)程:該過(guò)程將可以使用自動(dòng)編碼模版,從而用戶可以按自定義的順序,而不是默認(rèn)的ASCII碼順序進(jìn)行變量值的重編碼。另外,Autorecode過(guò)程將可以同時(shí)對(duì)多個(gè)變量進(jìn)行重編碼,以提高分析效率。
3)改進(jìn)的日期/時(shí)間函數(shù):本次的改進(jìn)將集中在使得兩個(gè)日期/時(shí)間差值的計(jì)算,以及對(duì)日期變量值的增減更為容易上。
結(jié)果報(bào)告
從10版起,對(duì)數(shù)據(jù)和結(jié)果的圖表呈現(xiàn)功能一直是SPSS改進(jìn)的重點(diǎn)。在16版中,SPSS推出了全新的常規(guī)圖功能,報(bào)表功能也達(dá)到了比較完善的地步。13版將針對(duì)使用中出現(xiàn)的一些問(wèn)題,以及用戶的需求對(duì)圖表功能作進(jìn)一步的改善。
1)統(tǒng)計(jì)圖:在經(jīng)過(guò)一年的使用后,新的常規(guī)圖操作界面已基本完善,本次的改進(jìn)除使得操作更為便捷外,還突出了兩個(gè)重點(diǎn)。首先在常規(guī)圖中引入更多的交互圖功能,如圖組(Paneled charts),帶誤差線的分類圖形如誤差線條圖和線圖,三維效果的簡(jiǎn)單、堆積和分段餅圖等。其次是引入幾種新的圖形,已知的有人口金字塔和點(diǎn)密度圖兩種。
2)統(tǒng)計(jì)表:幾乎全部過(guò)程的輸出都將會(huì)棄用文本,改為更美觀的樞軸表。而且樞軸表的表現(xiàn)和易用性會(huì)得到進(jìn)一步的提高,并加入了一些新的功能,如可以對(duì)統(tǒng)計(jì)量進(jìn)行排序、在表格中合并/省略若干小類的輸出等。此外,樞軸表將可以被直接導(dǎo)出到Microsoft Office PowerPoint中,這些無(wú)疑都方便了用戶的使用。
統(tǒng)計(jì)建模
Complex Samples是12版中新增的模塊,用于實(shí)現(xiàn)復(fù)雜抽樣的設(shè)計(jì)方案,以及對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行描述。但當(dāng)時(shí)并未提供統(tǒng)計(jì)建模功能。在13版中,這將會(huì)有很大的改觀。一般線形模型將會(huì)被完整地引入復(fù)雜抽樣模塊中,以實(shí)現(xiàn)對(duì)復(fù)雜抽樣研究中各種連續(xù)性變量的建模預(yù)測(cè)功能,例如對(duì)市場(chǎng)調(diào)研中的客戶滿意度數(shù)據(jù)進(jìn)行建模。對(duì)于分類數(shù)據(jù),Logistic回歸則將會(huì)被系統(tǒng)的引入。這樣,對(duì)于一個(gè)任意復(fù)雜的抽樣研究,如多階段分層整群抽樣,或者更復(fù)雜的PPS抽樣,研究者都可以在該模塊中輕松的實(shí)現(xiàn)從抽樣設(shè)計(jì)、統(tǒng)計(jì)描述到復(fù)雜統(tǒng)計(jì)建模以發(fā)現(xiàn)影響因素的整個(gè)分析過(guò)程,方差分析模型、線形回歸模型、Logistic回歸模型等復(fù)雜的統(tǒng)計(jì)模型都可以加以使用,而操作方式將會(huì)和完全隨機(jī)抽樣數(shù)據(jù)的分析操作沒(méi)有什么差別。可以預(yù)見(jiàn),該模塊的推出將會(huì)大大促進(jìn)國(guó)內(nèi)對(duì)復(fù)雜抽樣時(shí)統(tǒng)計(jì)推斷模型的正確應(yīng)用。
模塊
這個(gè)模塊實(shí)際上就是將以前單獨(dú)發(fā)行的SPSS AnswerTree軟件整合進(jìn)了SPSS平臺(tái)。筆者幾年前在自己的網(wǎng)站上介紹SPSS 11的新功能時(shí),曾經(jīng)很尖銳地指出SPSS的產(chǎn)品線過(guò)于分散,應(yīng)當(dāng)把各種功能較單一的小軟件,如AnswerTree、Sample Power等整合到SPSS等幾個(gè)平臺(tái)上去。看來(lái)SPSS公司也意識(shí)到了這一點(diǎn),而AnswerTree就是在此背景下第一個(gè)被徹底整合的產(chǎn)品。
Classification Tree模塊基于數(shù)據(jù)挖掘中發(fā)展起來(lái)的樹(shù)結(jié)構(gòu)模型對(duì)分類變量或連續(xù)變量進(jìn)行預(yù)測(cè),可以方便、快速的對(duì)樣本進(jìn)行細(xì)分,而不需要用戶有太多的統(tǒng)計(jì)專業(yè)知識(shí)。在市場(chǎng)細(xì)分和數(shù)據(jù)挖掘中有較廣泛的應(yīng)用。已知該模塊提供了CHAID、Exhaustive CHAID和C&RT三種算法,在AnswerTree中提供的QUEST算法尚不能肯定是否會(huì)被納入。
為了方便新老用戶的使用,Tree模塊在操作方式上不再使用AnswerTree中的向?qū)Х绞剑荢PSS近兩年開(kāi)始采用的交互式選項(xiàng)卡對(duì)話框。但是,整個(gè)選項(xiàng)卡界面的內(nèi)容實(shí)際上是和原先的向?qū)Щ疽恢碌模硗猓P偷慕Y(jié)果輸出仍然是AnswerTree中標(biāo)準(zhǔn)的樹(shù)形圖,這使得AnswerTree的老用戶基本上不需要專門的學(xué)習(xí)就能夠懂得如何使用該模塊。
由于樹(shù)結(jié)構(gòu)模型的方法體系和傳統(tǒng)的統(tǒng)計(jì)方法完全不同,貿(mào)然引入可能會(huì)引起讀者統(tǒng)計(jì)方法體系的混亂。為此,本次編寫的高級(jí)教程并未介紹該模塊,而將在高級(jí)教程的下一個(gè)版本,以及關(guān)于市場(chǎng)細(xì)分問(wèn)題的教材中對(duì)其加以詳細(xì)介紹。
兼容性
隨著自身產(chǎn)品線的不斷完善,SPSS公司的產(chǎn)品體系已經(jīng)日益完整,而不同產(chǎn)品間的互補(bǔ)和兼容性也在不斷加以改進(jìn)。在13版中,SPSS軟件已經(jīng)可以和其他一些最新的產(chǎn)品很好地整合在一起,形成更為完整的解決方案。例如,SPSS、SPSS 數(shù)據(jù) Entry和新發(fā)布的SPSS Text Analysis for Surveys一起就形成了對(duì)調(diào)查研究的完整解決方案。而新增的SPSS Classification Trees模塊將使得SPSS軟件本身就能夠針對(duì)市場(chǎng)細(xì)分工作提供更為完整的方法體系。
版本許可
版本許可SPSS Statistics有幾種版本。SPSS Statistics Gradpacks是僅出售給學(xué)生的高折扣版本。SPSS Statistics 商業(yè)版提供幾種不同的版本的永久或限期許可證供用戶選擇,附加軟件包可以通過(guò)附加功能增強(qiáng)基礎(chǔ)軟件。IBM 還為學(xué)術(shù)機(jī)構(gòu)提供了 SPSS Clementine 統(tǒng)計(jì)學(xué) Campus Edition,使其可以根據(jù)教學(xué)用途調(diào)整 SPSS Statistics 使用量。供整個(gè)校園使用的單一許可有助于簡(jiǎn)化許可管理,并為不限數(shù)量的用戶提供 SPSS Statistics 和 SPSS Amos 訪問(wèn)權(quán)限。
版本介紹
?SPSS 15.0.1-2006年11月
?SPSS 16.0.2-2008年4月
?SPSS Statistics 17.0.1-2008年12月
?PASW 統(tǒng)計(jì)學(xué) 17.0.2-2009年3月
?PASW Statistics 17.0.3-2009年11月
?PASW Statistics 18.0.0-2009年8月
?PASW Statistics 18.0.1-2009年12月
?PASW Statistics 18.0.2-2010年4月
?PASW Statistics 18.0.3-2010年9月
??IBM SPSS Statistics 19.0-2010年8月
??IBM SPSS 統(tǒng)計(jì)學(xué) 20.0-2011年8月
??IBM SPSS Statistics 21.0-2012年8月
??IBM SPSS Statistics 22.0-2013年8月
??IBM SPSS Statistics 23.0-2015年8月
??IBM SPSS Statistics 24.0-2016年8月
??IBM SPSS Statistics 25.0-2017年8月
??IBM SPSS 統(tǒng)計(jì)學(xué) 26.0-2019年5月
?自被IBM收購(gòu)后,SPSS Clementine保持每年發(fā)布一個(gè)新版本的更新頻率,發(fā)布時(shí)間通常為每年8月中旬。截至2025年11月,SPSS的最新版本為IBM SPSS Statistics v31。
產(chǎn)品特點(diǎn)
操作簡(jiǎn)便
界面非常友好,除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外,大多數(shù)操作可通過(guò)鼠標(biāo)拖曳、點(diǎn)擊“菜單”、“按鈕”和“對(duì)話框”來(lái)完成。
編程方便
具有第四代語(yǔ)言的特點(diǎn),告訴系統(tǒng)要做什么,無(wú)需告訴怎樣做。只要了解統(tǒng)計(jì)分析的原理,無(wú)需通曉統(tǒng)計(jì)方法的各種算法,即可得到需要的統(tǒng)計(jì)分析結(jié)果。對(duì)于常見(jiàn)的統(tǒng)計(jì)方法,SPSS的命令語(yǔ)句、子命令及選擇項(xiàng)的選擇絕大部分由“對(duì)話框”的操作完成。因此,用戶無(wú)需花大量時(shí)間記憶大量的命令、過(guò)程、選擇項(xiàng)。
功能強(qiáng)大
具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、報(bào)表、圖形制作等功能。自帶11種類型136個(gè)函數(shù)。SPSS提供了從簡(jiǎn)單的統(tǒng)計(jì)描述到復(fù)雜的多因素統(tǒng)計(jì)分析方法,比如數(shù)據(jù)的探索性分析、統(tǒng)計(jì)描述、列聯(lián)表分析、二維相關(guān)、秩相關(guān)、偏相關(guān)、方差分析、非參數(shù)檢驗(yàn)、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。
數(shù)據(jù)接口
能夠讀取及輸出多種格式的文件。比如由dBASE、Visual FoxPro、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉(zhuǎn)換成可供分析的SPSS Clementine數(shù)據(jù)文件。能夠把SPSS的圖形轉(zhuǎn)換為7種圖形文件。結(jié)果可保存為*.txt及HTML格式的文件。
模塊組合
SPSS for Windows軟件分為若干功能模塊。用戶可以根據(jù)自己的分析需要和計(jì)算機(jī)的實(shí)際配置情況靈活選擇。
針對(duì)性強(qiáng)
SPSS針對(duì)初學(xué)者、熟練者及精通者都比較適用。并且很多群體只需要掌握簡(jiǎn)單的操作分析,大多青睞于SPSS,像薛薇的《基于SPSS的數(shù)據(jù)分析》一書也較適用于初學(xué)者。而那些熟練或精通者也較喜歡SPSS,因?yàn)樗麄兛梢酝ㄟ^(guò)編程來(lái)實(shí)現(xiàn)更強(qiáng)大的功能。
軟件平臺(tái)
SPSS自SPSS16.0起推出Linux版本。SPSS最新版本為SPSS 24.0,已支持Windows 8/10、Mac OS X、Linux及unix。
其他相關(guān)
Clementine
SPSS Clementine是ISL(Integral Solutions Limited)公司開(kāi)發(fā)的數(shù)據(jù)挖掘工具平臺(tái)。1999年SPSS公司收購(gòu)了ISL公司,對(duì)Clementine產(chǎn)品進(jìn)行重新整合和開(kāi)發(fā),Clementine已經(jīng)成為SPSS公司的又一亮點(diǎn)。
作為一個(gè)數(shù)據(jù)挖掘平臺(tái),Clementine結(jié)合商業(yè)技術(shù)可以快速建立預(yù)測(cè)性模型,進(jìn)而應(yīng)用到商業(yè)活動(dòng)中,幫助人們改進(jìn)決策過(guò)程。強(qiáng)大的數(shù)據(jù)挖掘功能和顯著的投資回報(bào)率使得Clementine在業(yè)界久負(fù)盛譽(yù)。同那些僅僅著重于模型的外在表現(xiàn)而忽略了數(shù)據(jù)挖掘在整個(gè)業(yè)務(wù)流程中的應(yīng)用價(jià)值的其它數(shù)據(jù)挖掘工具相比,Clementine其功能強(qiáng)大的數(shù)據(jù)挖掘算法,使數(shù)據(jù)挖掘貫穿業(yè)務(wù)流程的始終,在縮短投資回報(bào)周期的同時(shí)極大提高了投資回報(bào)率。
廣泛分析帶來(lái)最優(yōu)結(jié)果
為了解決各種商務(wù)問(wèn)題,企業(yè)需要以不同的方式來(lái)處理各種類型迥異的數(shù)據(jù),相異的任務(wù)類型和數(shù)據(jù)類型就要求有不同的分析技術(shù)。Clementine為您提供最出色、最廣泛的數(shù)據(jù)挖掘技術(shù),確保您可用最恰當(dāng)?shù)姆治黾夹g(shù)來(lái)處理相應(yīng)的問(wèn)題,從而得到最優(yōu)的結(jié)果以應(yīng)對(duì)隨時(shí)出現(xiàn)的商業(yè)問(wèn)題。即便改進(jìn)業(yè)務(wù)的機(jī)會(huì)被龐雜的數(shù)據(jù)表格所掩蓋, Clementine也能最大限度地執(zhí)行標(biāo)準(zhǔn)的數(shù)據(jù)挖掘流程,為您找到解決商業(yè)問(wèn)題的最佳答案。
CRISP-DM使數(shù)據(jù)挖掘成為標(biāo)準(zhǔn)的商業(yè)流程
為了推廣數(shù)據(jù)挖掘技術(shù),以解決越來(lái)越多的商業(yè)問(wèn)題,SPSS Clementine和一個(gè)從事數(shù)據(jù)挖掘研究的全球性企業(yè)聯(lián)盟制定了關(guān)于數(shù)據(jù)挖掘技術(shù)的行業(yè)標(biāo)準(zhǔn)--CRISP-DM(Cross-Industry Standard Process for Data Mining)。與以往僅僅局限在技術(shù)層面上的數(shù)據(jù)挖掘方法論不同,CRISP-DM把數(shù)據(jù)挖掘看作一個(gè)商業(yè)過(guò)程,并將其具體的商業(yè)目標(biāo)映射為數(shù)據(jù)挖掘目標(biāo)。一次調(diào)查顯示,50%以上的數(shù)據(jù)挖掘工具采用的都是CRISP-DM的數(shù)據(jù)挖掘流程,它已經(jīng)成為事實(shí)上的行業(yè)標(biāo)準(zhǔn)。
Clementine完全支持CRISP-DM標(biāo)準(zhǔn),這不但規(guī)避了許多常規(guī)錯(cuò)誤,而且其顯著的智能預(yù)測(cè)模型有助于快速解決出現(xiàn)的問(wèn)題。
應(yīng)用模板的結(jié)果
在數(shù)據(jù)挖掘項(xiàng)目中使用Clementine應(yīng)用模板(CATs)可以獲得更優(yōu)化的結(jié)果。應(yīng)用模板完全遵循CRISP-DM標(biāo)準(zhǔn),借鑒了大量真實(shí)的數(shù)據(jù)挖掘?qū)嵺`經(jīng)驗(yàn),是經(jīng)過(guò)理論和實(shí)踐證明的有效技術(shù),為項(xiàng)目的正確實(shí)施提供了強(qiáng)有力的支撐。Clementine中的應(yīng)用模板包括:
CRM CAT--針對(duì)客戶的獲取和增長(zhǎng),提高反饋率并減少客戶流失;
Web CAT--點(diǎn)擊順序分析和訪問(wèn)行為分析;
Telco CAT--客戶保持和增加交叉銷售;
Crime CAT--犯罪分析及其特征描述,確定事故高發(fā)區(qū),聯(lián)合研究相關(guān)犯罪行為;
Fraud CAT--發(fā)現(xiàn)金融交易和索賠中的欺詐和異常行為;
Microarray CAT--研究和疾病相關(guān)的基因序列并找到治愈手段。
結(jié)構(gòu)方程模型
確定復(fù)雜的關(guān)系
在社會(huì)科學(xué)以及經(jīng)濟(jì)、市場(chǎng)、管理等研究領(lǐng)域,有時(shí)需要處理多個(gè)原因多個(gè)結(jié)果間的復(fù)雜關(guān)系,或者會(huì)碰到不可直接觀測(cè)的變量(即潛變量),這些都是傳統(tǒng)的統(tǒng)計(jì)方法不好解決的問(wèn)題。二十世紀(jì)八十年代以來(lái),結(jié)構(gòu)方程分析迅速發(fā)展,彌補(bǔ)了傳統(tǒng)統(tǒng)計(jì)方法的不足,成為多元數(shù)據(jù)分析的重要工具。
簡(jiǎn)單而言,與傳統(tǒng)的回歸分析不同,結(jié)構(gòu)方程分析能同時(shí)處理多個(gè)因變量,并可以比較評(píng)價(jià)不同因果關(guān)系的理論模型。與傳統(tǒng)的探索性因子分析不同,在結(jié)構(gòu)方程模型中,我們可以提出一個(gè)特定的因子結(jié)構(gòu),并檢驗(yàn)它是否吻合數(shù)據(jù)。通過(guò)結(jié)構(gòu)方程多組分析,我們可了解不同組別(如不同性別)內(nèi)各變量的關(guān)系是否保持不變,各因子的均值是否有顯著差異。
國(guó)際上關(guān)于教育與心理統(tǒng)計(jì)的研究取得了快速的發(fā)展,結(jié)構(gòu)方程模型可以說(shuō)是其中發(fā)展較快,應(yīng)用廣泛的多元統(tǒng)計(jì)分析技術(shù);在商業(yè)領(lǐng)域的品牌研究、顧客滿意度研究等方向上也得到了廣泛的應(yīng)用。在我國(guó),SEM研究方法還在管理學(xué)、經(jīng)濟(jì)學(xué)、醫(yī)學(xué)及社會(huì)學(xué)研究等領(lǐng)域的應(yīng)用也得到了快速的發(fā)展。
結(jié)構(gòu)方程模型(SEM)是國(guó)際管理研究和其他社會(huì)科學(xué)研究中日益廣泛采用的建模技術(shù),每年的美國(guó)管理學(xué)會(huì)年會(huì)上都有專題教學(xué)和研討。SEM越來(lái)越成為各類高層次學(xué)術(shù)刊物、高層次管理研究以及社會(huì)學(xué)和經(jīng)濟(jì)學(xué)等學(xué)科研究領(lǐng)域的必備方法。
AMOS軟件簡(jiǎn)介
AMOS是SPSS 統(tǒng)計(jì)學(xué)軟件包中的獨(dú)立產(chǎn)品,是功能強(qiáng)大的結(jié)構(gòu)方程(SEM)建模工具,通過(guò)對(duì)包括回歸、因子分析、相關(guān)性分析和方差分析等傳統(tǒng)多元分析方法的擴(kuò)展,為您的理論研究提供更多的支持。
在AMOS環(huán)境下,您可以在直觀的路徑圖下指定、估計(jì)、評(píng)估以及設(shè)定模型,以展示假定的各變量之間的關(guān)系,來(lái)方便地地建立能真實(shí)反應(yīng)復(fù)雜關(guān)系的行為態(tài)度模型。在AMOS中,任何數(shù)值變量,不管是可觀測(cè)的還是潛在的,都可以用來(lái)建模,預(yù)測(cè)其它數(shù)值變量。AMOS快速創(chuàng)建模型以檢驗(yàn)變量之間的相互影響及其原因,由于結(jié)構(gòu)方程模型是一次性地驗(yàn)證復(fù)雜的因果關(guān)系,用標(biāo)準(zhǔn)方法以及在此基礎(chǔ)上擴(kuò)展的方法進(jìn)行多元分析,因此比普通最小二乘回歸和探索性因子分析更進(jìn)一步,能獲得更精確、豐富的綜合分析結(jié)果。
使用AMOS直觀的拖放式繪圖工具,您可以快速地以路徑圖定制模型而無(wú)需編程。在有缺失值的情況下,AMOS使用Full Information Maximum Likelihood方法仍然可以自動(dòng)計(jì)算正確的標(biāo)準(zhǔn)誤及適當(dāng)?shù)慕y(tǒng)計(jì)量,降低估算值偏差。新版本的AMOS還增加了探索性結(jié)果方程模型、輔助多組分析、高級(jí)文本輸出、擴(kuò)展的AMOS編程環(huán)境等功能。AMOS被廣泛地應(yīng)用于顧客滿意度分析等領(lǐng)域。
同類軟件
參考資料 >
SPSS統(tǒng)計(jì)分析實(shí)用寶典.清華大學(xué)出版社.2024-03-08
IBM SPSS software.IBM.2024-03-06
數(shù)據(jù)分析實(shí)驗(yàn)室實(shí)驗(yàn)軟件簡(jiǎn)介.江蘇大學(xué)圖書館.2024-03-06
SPSS軟件介紹與下載.西南石油大學(xué).2024-03-06
用SPSS做數(shù)據(jù)分析?先弄懂SPSS的基礎(chǔ)知識(shí).CDA數(shù)據(jù)分析師.2024-03-06
IBM SPSS Statistics GradPack 和 Faculty Pack.IBM.2025-04-05
IBM SPSS Statistics 商業(yè)版.IBM.2025-04-05
面向?qū)W術(shù)機(jī)構(gòu)的 IBM SPSS Statistics.IBM.2025-04-05