來源:互聯網
Tera是一個高性能、可伸縮的結構化數據存儲系統,被設計用來管理搜索引擎萬億量級的超鏈與網頁信息。為實現數據的實時分析與高效訪問,我們使用按行鍵、列名和時間戳全局排序的三維數據模型組織數據,使用多級Cache系統,充分利用新一代服務器硬件大內存、SSD盤和萬兆網卡的性能優勢,做到模型靈活的同時,實現了高吞吐與水平擴展。
系統特性
??全局有序
??熱點自動分片
??數據強一致
??多版本,自動垃圾收集
??按列存儲,支持內存表
??動態Schema
??支持表格快照
??高效隨機讀寫
數據模型
Tera使用了bigtable的數據模型,可以將一張表格理解為這樣一種數據結構:
map
其中RowKey、ColumnFamily、Qualifier和Value是字符串,Timestamp是一個64位整形。ColumnFamliy需要建表時指定,是訪問控制、版本保留等策略的基本單位。
參考資料 >