大數據資料移轉

舊有歸檔系統移轉至私有雲架構

當企業考慮想通過電子郵件私有雲技術來落實和解決常規歸檔備份的不足時,主要會遇到的難題是:如何將常規備份或歸檔保留下來的大量歷史郵件資料移轉和導入到私有雲歸檔系統;其實瞭解電子郵件的特性,對於歷史郵件這些大數據的遷移工作來說並不是困難的事。

我們知道 RFC822 定義的電子郵件通用標準格式為 eml,任何一封電子郵件所攜帶的所有訊息都可以透過一個 eml 檔來保存和跨平台傳輸。企業私有雲電子郵件歸檔平台可以直接處理標準 eml 格式的郵件,所以私有雲歸檔平台主要也是透過 eml 這種格式在各種異構平台之間來實現導入和遷移,整個遷移流程分三步:

Format transfer  EML Import Index & storage

1.  歷史資料格式轉換

若原本郵件資料的保存形式為非 eml 格式的情況,比如壓縮打包過的檔案類型,則需要全部解壓提取為 eml 格式後再進行處理;若是 Exchange 獨有的 PST 格式,則需要借助一些工具,將其匯出為通用的 eml 格式再進行處理。

2. Eml 導入私有雲歸檔平台

Eml 導入私有雲平台的方法很簡單也很高效:透過一個輕巧的 SMTP Agent,直接讀取這些歷史 eml,然後以標準 SMTP 協定發送給私有雲平臺的接收主機,即可完成導入工作,並可保證eml 資料的完整性。

3. 建立分散式 index 和資料儲存

在 eml 導入到平台時,會給每一封郵件即時建立 Full Text Index,並自動按照科學演算法分發 index 到內部不同的GSA(Grid Search Agent)上,實現分散式的 index 管理,為後續的高效率查詢搜索奠定基礎。另外還會根據所設定的郵件生命週期管理政策,將 EML 儲存到對應的不同 Storage 上;以上過程全部自動化完成,無需人工干預,管理員無需擔心和記憶每個儲存空間內是存放哪個時期的郵件,全部都會由私有雲歸檔平台來搞定。

未來擴充與管理的好處

1. 良好的擴充性

企業私有雲歸檔平台採用開放式架構設計,允許企業可以在任何時候輕鬆擴展 GSA 的數量以保持優秀的查詢效率和操作體驗;同時也支援隨時擴充更多的網路存放裝置和資源。幫助企業輕鬆應對未來歸檔郵件資料持續增長時,搜索效率的更高要求,以及需要更多儲存空間的需求。

2. 網格搜索的運作機制

私有雲歸檔平台採用業內首創的分散式索引機制 Grid Search,這一技術使得企業對電子郵件的查詢操作體驗就跟使用網頁搜索引擎查詢一樣的方便有效!Grid Search 會將郵件的 index 合理分佈在每台 GSA 成員上進行管理,當用戶提交一個查詢請求時,網格控制器 GC 會將該請求按所查詢的時間區間拆分為 N 個請求,並分發給每台 GSA 做分散式查詢,所以和傳統單台的歸檔設備相比,Grid Search 所需要的時間為傳統搜索的 1/N 其中 N 為 GSA 的數量;所以 GSA 擴展越多,搜尋速度會越快;因此 GSA 的擴展性是搜尋效率的有力保證。  

3. 統一查詢,統一管理

雖然 Grid Search 的內部運作機制看似複雜,多台設備協同配合工作,但管理者對私有雲歸檔平臺的管理和操作卻是非常之簡單和方便。

對郵件的查詢,管理者只需要登錄 GC 的 reporter 介面,下達搜尋條件即可,Grid Search 會自動將每台 GSA 搜索的結果快速呈現在當前介面上。所找到的郵件,無論存放在本地磁片,還是在近線的網路儲存裝置,均可以直接在查詢結果上直接打開和操作。真正的統一查詢讓管理者完全感受不到後端多台分散式處理的過程,使用體驗就跟在本地搜索郵件一樣。

對於私有雲平台和儲存的管理,管理者只需要登錄 GC 的 gateway 介面,在這一個網站上即可輕鬆實現對整個私有雲歸檔平台的配置,以及網路存儲的擴展和配置。並且每一個 GSA 成員均會在 GC 的管理下自動完成自身的配置和資料的分派任務,完全無需管理員干預和設定,因此統一管理的優勢將幫助管理員輕鬆掌控私有雲歸檔平台的一切!

相關產品: