互聯網檔案館(The Internet Archive),自1996年成立起,總部位于舊金山,定期收錄并永久保存全球網站上可以抓取的信息,提供互聯網多媒體資料檔案閱覽服務的數位圖書館。截至2012年10月,其信息儲量達到10PB。其宗旨是“普及所有知識”,提供數字資料的永久性免費儲存及獲取。
簡介
由Alexa創始人布魯斯特·卡利(Brewster Kahle)創辦,互聯網檔案館是一個提供Wayback Machine服務的非營利性的數字圖書館組織。非正式中文名有“網站時光倒流機器”“互聯網檔案館”等。對于不同的網站,其收錄的網頁數量和收集周期也不相同,其數據是由自帶的網絡爬蟲自動搜集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。一些大型網站可能每天都會被“備份”一次,每次可能收錄數十個以上的網頁,而一些小型網站可能每年收錄幾次,每次只有幾個網頁。對網站不同時期的歷史資料進行研究,是互聯網檔案館最大的價值所在。用戶可以通過Internet Archive的“Take Me Back”對網站的發展與歷史資料進行研究。
歷史
1996年,卡利(Brewster Kahle)在創立盈利性的Alexa Internet的同時也創立了互聯網檔案館;同年10月開始收集存儲數據[。而檔案館亦曾于1996年5月10日下午2:42保存了已知最早的頁面。不過,直到2001年開發了“時光機”前,這些數據都無法訪問。1999年末擴展收集范圍。
2012年8月,互聯網檔案館宣布將在其現存的130萬文件的下載選項中加入BitTorrent。因為透過兩個文件數據中心協調,這成為從該檔案館下載數據的最快方法。
2013年11月6日,檔案館在里奇蒙德區的總部失火,損壞了許多設備和一些附近的公寓,預計損失達到60萬美元。2014年11月,互聯網發布測試版,2016年3月,移除舊布局。
2016年11月,卡利宣布互聯網檔案館正在建立加拿大分站,總部將設在加拿大,但具體地點沒有公布。媒體報道中,卡利表示?:11月9日,在美國,我們突然意識到一個承諾進行徹底變革的新政府的出現。這強有力地提醒我們,像我們這樣有長期計劃的機構,也需要為適應變化而設計。對我們來說,這意味著我們要保持我們的文化材料的安全、隱私和永遠可訪問。這意味著要為一個可能面臨更大限制的網絡做準備。這意味著在一個政府監視不會消失的世界里為用戶服務;事實上,政府監視看起來還可能會再增加。縱觀歷史,圖書館一直在與嚴重的侵犯隱私的行為作斗爭——人們僅僅因為他們閱讀的內容便遭到逮捕。而互聯網檔案館正在努力保護我們的讀者在數字世界的隱私。
從2017年開始,OCLC(OCLC]]和互聯網檔案館通過合作,使該檔案館的數字化圖書記錄可在WorldCat上訪問。
2018年以來,互聯網檔案館推出視覺藝術入駐項目,將藝術家與檔案館超過48pb的 數字化材料聯系起來。在為期一年的項目中,視覺藝術家創作了大量作品,頂峰時期還舉行了展覽。其期望是將數字歷史與藝術聯系起來并為后代創造一些能在線上或線下欣賞的東西。2019年,互聯網檔案館位于舊金山的總部收到炸彈威脅,迫使該大樓暫時被騰空。2023年3月,美國一名法官裁定,互聯網檔案館(Internet Archive)經營的在線圖書館出借數字掃描版圖書,侵犯了美國四家主要出版商的版權。
互聯網檔案館的大部分材料來自捐贈,例如2017年波士頓公共圖書館提供的大量78轉/分鐘的光盤,2018年特倫特大學捐贈的25萬本圖書,以及馬里格魯夫學院圖書館在2020年關閉后的全部藏品。其后所有材料經過數字化后進行數字存儲,而數字副本返回原始持有者以及在互聯網文件進行復制,如果不是公共領域中的內容,可在遵循首次銷售原則的受控數字借閱(CDL)理論的前提下,每次借給世界各地的一個顧客。
檔案計劃
“互聯網檔案計劃”分為六大部分:
一、電子書
這個部分,我以前已經介紹過了,它專門收集公共領域的書籍和文檔,任何人都可以免費下載。截至2013年7月,檔案館共收集了440萬本書,每月的下載量超過1500萬。
它主要收集英語書籍,但也包括少部分其他語種的書籍,比如朱熹的《論語集注》。
二、網頁
這個部分有個專門的名字,叫做”時光倒流機器“(Wayback Machine),它像收集舊報紙那樣收集舊網頁。舉例來說,雅虎的首頁就有5000多份檔案,最早的可以回溯到1996年10月17日,最近的則是2007年8月30日。
要將全世界的網頁都保存下來,這需要多大的存儲容量啊。根據2006年的統計,當時Wayback Machine的存儲容量有2000T,然后還在以每月20T的速度增加。
三、視頻
這個部分收集視頻材料,你在其中可以找到動畫片和電影。
四、音頻
音頻材料主要是有聲書籍和音樂。
五、軟件
六、教育材料
這部分主要是美國大學課程,有視頻和文字材料下載,相當于不去北美就可以上那里的課,比如麻省理工學院的《微分方程》和Naropa大學的《艾倫·金斯堡的詩歌》。
參考資料 >