數字對象標識符(Digital object identifier,簡稱DOI)是一組由數字、字母或其他符號組成的字符串,是一種永久標識符或句柄,任何實體(數字、物理或抽象)都可以通過稱為DOI號的全球唯一且持久的標識符來識別。
DOI起源于出版業(yè)內三個(國際出版商協(xié)會,國際科學、技術和醫(yī)學出版商協(xié)會,美國出版商協(xié)會)的聯(lián)合倡議。該系統(tǒng)于1997年法蘭克福書展上發(fā)布。同年,DOI基金會成立,負責開發(fā)和管理DOI系統(tǒng)。從1998年起,基金會與INDECS項目(1998-2000)以及在此基礎上開展的一系列后續(xù)和持續(xù)舉措密切合作。DOI系統(tǒng)提供了一個技術和社會基礎設施,組織可以在該基礎設施上構建應用程序來為用戶或用戶社區(qū)提供服務。2010年DOI通過了ISO國際標準認證。截至2015年,全球已有1億個已經分配并解析的DOI編碼,9個RA(DOI注冊代理機構)和上萬個注冊單位,使用范圍跨越了美國、歐洲和澳大利亞以及一些非英語國家,應用領域也從數字文獻出版商擴展到政府部門。愛思唯爾、Blackwell、John Wiley、Springer等大型出版商大多使用DOI對數字資源進行標識,形成了比較完整的命名、申請、注冊、變更等管理機制,DOI的解析系統(tǒng)發(fā)展也比較成熟。
DOI具有唯一性、永久性、開放性、動態(tài)維護性、多項解析、動態(tài)追蹤、版權保護等特點,DOI是實現(xiàn)開放式知識鏈接的基礎,促進了資源整合與共享,有效保護了數字資源的知識產權。
概述
DOI是一組由數字、字母或其他符號組成的字符串,用于標識數字化的內容資源,可以分配給任何使用網絡的數字實體,廣泛用于識別學術、職業(yè)和政府信息,例如期刊論文、研究報告和數據集以及官方出版物。也可以被用于識別其他類型的信息資源,例如商業(yè)視頻等。可以通過將DOI綁定到元數據(如URL,即網址)來找到對象的位置。它既有一套為資源命名的機制,也有一套將識別號解析為具體地址的協(xié)議,基于Handle System的實體識別系統(tǒng),用于解析標識符的全球分布式系統(tǒng)。DOI號可以解析為資源,例如Web或互聯(lián)網資源、描述實體的元數據、可訪問更多資源的登陸頁面等。
發(fā)展歷程
DOI的誕生可追溯到1994年美國出版商協(xié)會(The Association of American Publishers,AAP)下屬“技術授權委員會”(Enabling Technologies Committee)的成立,該委員會的任務是設計一種在數字環(huán)境下保護知識產權和版權所有者商業(yè)利益的系統(tǒng)。DOI系統(tǒng)由國際出版商協(xié)會,國際科學、技術和醫(yī)學出版商協(xié)會,美國出版商協(xié)會倡議并建設的。起初,DOI系統(tǒng)只服務于文字出版類資源,作為數字環(huán)境下進行版權管理和保護的工具,公眾認為DOI系統(tǒng)是一個能夠勝任管理和識別數字網絡內容、標識整合數字資源和多媒體應用的通用框架。DOI于1997年發(fā)布于法蘭克福書展,由IDF(世界銀行機構發(fā)展基金)對DOI系統(tǒng)進行管理和功能完善。IDF認為Handle System是具有迄今為止最完善的管理數字對象架構,因此DOI選擇基于Handle System來進行研發(fā),但對于管理知識內容、促進電子商務建設的DOI系統(tǒng)還需要在Handles基礎上增加新功能以完善其框架DOI系統(tǒng)建立后,IDF選擇CNRI作為其技術合作伙伴,且從1998年開始參與INDECS項目INDECS框架支持DOI數據模型。IDF在CNRI的配合下,制定了DOI標準和相應的解析系統(tǒng)Handle System。2000年,DOI語法通過了NISO標準化,2010年DOI系統(tǒng)被ISO批準為國際標準。該標準規(guī)定了數字對象標識符系統(tǒng)的語法、描述方式和解析功能組件以及DOI名稱的創(chuàng)建注冊和管理的一般規(guī)則。于2012年5月DOI標準正式出版印刷。
多數西文出版社和全文數據庫均采用了DOI作為文章的唯一標識,DOI已經在許多領域中得到實際應用,其中包括,、Blackwell、John Wiley、Springer等大型出版商大多使用DOI對數字資源進行標識,以及中國的出版社,如、中國科學出版社等;也包括小型的、非贏利性的行業(yè)協(xié)會或學會,如(ACM)、英國的(CUP)、出版社(OUP)、中國的、中國力學學會等;還包括新型的開放性出版社,如Biomed Central;部分二次文獻出版社如CABI Publishing也是聯(lián)盟成員;另外,還有國家或國際組織,如WHO Press(出版社)和以及信息服務機構,如日本科技機構()、德國科技信息所(TIB)等。根據CrossRef的統(tǒng)計,截至2015年4月27日,加入CrossRef的出版商和學會共計4733個,圖書館1950個,覆蓋期刊38895個,其中非營利性出版商占比57%,DOI國際標準在科技期刊數字化和國際化方面的應用,已越來越成熟。截至2020年12月31日,有超過15000位成員或者組織加入了CrossRef,并且有超過1.28億個學術內容項目的元數據存存儲。
結構與規(guī)則
DOI的編碼方案(即美國標準ANSI/NISO Z39.84-2000)規(guī)定,DOI的結構式為:
10.1234/567810.23416
10.5678/978-0-7645-4889-4
10.1000/ISBN0764548891
10.1234/Norman..presentation10.2224/2003-1-29
DOI前綴由兩部分組成,一個是目錄代碼,另一個是登記機構代碼。前綴中又以小圓點分為兩部分,
DOI后綴是一個在特定前綴下唯一的后綴,后綴
根據IDF(International DOI Foundation,國際DOI基金會)出版的DOI手冊中規(guī)定,DOI編碼不區(qū)分大小寫,并且必須能被任意DOI系統(tǒng)識別。例如:DOI編碼“10.1234/abc”與“10.1234/ABC”實際上是完全相同的DOI編碼。
根據DOI編碼的語法規(guī)則,后綴可以為包含任何字母和數字的字符串。在實踐中,建議只使用數字、字母(0~9,a-2,A~Z),以及某些標點符號,包括連字符(“_”或2DHex)、句點(“.”或2EHex)以及下劃線(“_”或5FHx),而不要使用任何其它ASCII字符或U007F以上的字符。例如:10.XXXX/LJ Not Ref d Ginthner 0120052 中的“i”,同時,為了能夠正確的注冊和使用DOI編碼,避免在DOI編碼中使用某些字符,包括“#"、“&”、“<”、“>、“?”、“1”、“\”、“、“+”、“space”、“;”、“%”、“@”。下面就是一個有問題的DOI編碼:10.XXXX(SICD1096-8652(200004)63:4<205AID-AJH8>33.C0:2#。這個例子中使用了應該避免的字符“<”、“>“.”、“#”,在注冊DOI編碼時會引起錯誤。
表示
DOI號前面應帶有小寫“doi:”,除非上下文明確表明隱含DOI號。“doi:”標簽不是DOI號值的一部分。例如,DOI號“10.1006/jmbi.1998.2354”顯示并打印為“doi:10.1006/jmbi.1998.2354”。此表示符合IETF規(guī)范RFC 3986的語法,用于表示URI(統(tǒng)一資源標識符),與“ftp:”和“http:”的方式相同。DOI號是可操作的,注冊機構可以選擇打印DOI代理URL表格。然后,使用一些約定來顯示純DOI號和在線解析,例如:一種簡寫方式,“本文的DOI號是10.1002/prot.999,當前信息可以在網絡上找到”、通過https://doi/10.1002/prot.999”或“...可通過https://doi.org/...獲得”。
技術特點
DOI以兩種技術為基礎:Handle System和
解析機制
單一解析
單一地址解析機制提供了對數字資源的永久訪問。DOI能夠唯一性地標識一個單獨的數字資源,并且可以保證在網絡上永久鏈接到這個數字資源。因此,DOI系統(tǒng)的核心功能就是將DOI解析到登記注冊的URL地址上,通過DOI代理服務器可以方便、可靠地鏈接到全文。
為了避免由于資源地址的改變而造成用戶鏈接的失效,DOI系統(tǒng)對資源的地址進行了有效的管理。出版商為其每個資源注冊DOI時,要同時向Handle System主機提交資源的DOI名稱和網址(URL),它們都存放在DOI Directory中。出版商負責對DOI數據的維護,當資源地址發(fā)生改變,如網絡期刊文章從現(xiàn)刊目錄轉到存檔目錄時,出版商應通知Handle System主機作相應的改變,以確保鏈接的有效性。當用戶點擊資源的DOI索取信息時,用戶的請求被傳送到Handle System服務器上,Handle System服務器將查詢DOI Directory,然后將DOI解析為URL返還給用戶終端,使用戶實現(xiàn)對資源的訪問。這一切都在后臺進行,對用戶來說,無需理會資源地址的任何更動,面對的始終只是同一個DOI,DOI提供的資源鏈接具有永久有效性。
多重解析
DOI提供多重解析的增值服務,更好地促進科技期刊論文等的傳播。多重解析是指一個DOI編碼,可以對應多個解析地址。即:一個被標識的數字對象會有很多相關資源,并且可能會有多個復本放置于不同的地方。Handle System的多重解析機制使DOI不僅能指向一個URL,而且可以指向多個相關URL,以及其他類型的元數據。下表顯示了一個DOI可以解析為多種類型的數據。
優(yōu)點
唯一性
DOI標識符作為數字化對象的識別符,對所標識的數字對象而言,相當于人的身份證,具有唯一性。這種特性保證了在網絡環(huán)境下對數字化對象的準確提取,有效地避免重復。
持久性
一個數字化對象的DOI標識符一經產生就永久不變,不隨其所標識的數字化對象的版權所有者或存儲地址等屬性的變更而改變。
兼容性
DOI標識符的兼容性體現(xiàn)在DOI號碼的后綴中可以包含任何已有的標識符,例如國際標準書號ISBN,國際標準刊號ISSN,國際標準文本代碼ISTC,出版物件標識符PII等。
互操作性
DOI系統(tǒng)提供與數字對象相關的元數據,可以使不同的應用系統(tǒng)了解DOI標識符代表的數字對象,從而為應用系統(tǒng)的互聯(lián)互通提供了技術基礎。
動態(tài)更新
在DOI系統(tǒng)中,可對DOI關聯(lián)的元數據進行動態(tài)更新,保證DOI標識符提供的信息的有效性。如對數字對象的鏈接地址進行更新,可以有效避免“死鏈”的產生。
國際通用
2010年11月,DOI系統(tǒng)(ISO 26324 Information and documentation — Digital object identifier system)正式成為ISO標準,并于2012年5月10日正式發(fā)布。各國相關產業(yè)鏈的參與者可遵循統(tǒng)一的DOI標準對數字對象進行標識、解析鏈接,可大大降低產業(yè)的技術溝通成本和社會溝通成本,促進跨國別、跨語言、跨系統(tǒng)、跨機構的資源鏈接和共享利用。
DOI相比傳統(tǒng)標識符的優(yōu)勢
應用場景
學術研究領域
DOI常用于學術研究領域,為學術論文、期刊文章、圖書、報告等數字資源賦予全球唯一的標識符。通過DOI,研究人員可以方便地引用和鏈接到相關文獻的全文或特定部分,提高研究效率。
學術出版領域
DOI在學術出版領域的應用也十分廣泛。出版商可以使用DOI標識符來鏈接到已發(fā)表的論文或書籍的電子版,方便讀者獲取全文。此外,DOI還可以用于出版物的元數據管理,方便出版商、圖書館員和研究人員檢索和管理信息。
學術評價體系
DOI在學術評價體系中也有重要作用。學術期刊和出版商通常要求作者在提交論文時提供DOI號,以便將論文與已發(fā)表的文獻進行比較和引用分析。這有助于評估論文的質量和影響力,為學術期刊和作者的學術聲譽評價提供參考。
圖書館和信息管理領域
圖書館和信息管理機構可以利用DOI進行數字資源的標識、管理和檢索。通過DOI,圖書館可以將本館的電子資源與全球的學術資源進行鏈接,方便讀者獲取所需信息。同時,DOI還可以幫助信息管理機構對海量數據進行分類、組織和存儲,提高信息管理的效率和質量。
其他領域的應用
DOI所標識的數字對象類型越來越廣泛,除上述的期刊、圖書、科學數據之外,還包括會議錄、學位論文、標準、科技報告等各種文獻資源,并且于2010年跨越了出版行業(yè),正式進入影視作品領域。2010年6月,成立于好萊塢的娛樂業(yè)標識注冊(Entertainment ID Registry,EIDR)服務申請加入IDF,并被批準為RA,2011年11月底,其DOI注冊量已超過24萬。其他類型的數字對象也將逐步納入DOI的標識范圍內。西文DOI的發(fā)展充分證明了西方各數字出版商在合作中求生存的理念。通過這種理念的實施,在為圖書館和用戶帶來了最好的服務的同時,也拓展了整個行業(yè)的生存空間。
DOI基金會
國際數字對象識別號基金會(International DOl Foundation)是成立于1998年的非營利組織,它是DOI系統(tǒng)的行政主體。DOI基金會管理DOI注冊并為其各自社區(qū)提供服務的機構管理數字對象標識符(DOI)系統(tǒng),保障與DOI系統(tǒng)相關的知識產權,推廣DOI的運用,并確保DOI系統(tǒng)的一切改進(如創(chuàng)造維護、注冊、解析與相關決策)能為全體注冊者使用。2008年通過國際標準化組織(ISO)認證。DOI標準和解析系統(tǒng)是1994年由美國出版協(xié)會(American Associate of Publishing,AAP)成立的非營利性組織國際DOI基金會(International POI Foundation,IDF)在美國國家創(chuàng)新研究組織(Corporation of National Research Initiatives,CNRI)的配合下制定的。2012年5月1日《ISO 26324 信息與文檔-DOI 系統(tǒng)》由ISO出版,并在ISO官網發(fā)布。IDF既是DOI系統(tǒng)的創(chuàng)建者,也是《ISO 26324信息與文檔DOI系統(tǒng)》的注冊權力機構。
參考資料 >
數字化內容如何標識?.中國新聞網.2023-11-23
淺談DOI:什么是數字對象唯一識別符?.四川大學學術誠信與科學探索網.2023-11-23
Basic Principle: Integration of Identifier Resolution and Semantics.DOI官網.2023-12-01
History and Purpose of the DOI ? System.DOI官網.2023-12-01
中文DOI.中文DOI.2023-11-23
An Introduction to Crossref. Crossref.2023-12-10
萬方數據聲明 ×.萬方數據.2023-11-23
萬方數據知識服務平臺.萬方數據.2023-11-23
DOI到底是什么?.AEIC學術交流中心.2023-11-23
DOI編碼與印刷指南v1.4.萬方數據.2023-11-24
Presentation Formats of a DOI Name.DOI官網.2023-12-01
DOI簡介與功能.上海理工大學.2023-11-24
About Us.DOI官網 .2023-12-10