 |
圖一、「雲端計算應用與發展」論壇。 |
|
近年來隨著數位技術的進步,人們每天產生的數位資料越來越多,電腦所要處理的資料量也越來越大,然而單一硬體設備無法無限加速或是無限制地加大記憶和儲存空間,於是近代的研究人員提出了雲端計算(Cloud
Computing)的解決方案。雲端計算的架構是一種基於網際網路的分散式運算技術,將各個不同的電腦利用網路互相連接,並結合所有電腦的運算能力,讓運算效果幾乎等於是所有聯結起來的電腦總合的運算能力。因為雲端計算採用的是共享基礎架構,即便是加入更多的資源,其管理成本也不會明顯改變,此特性讓雲端計算成為當前最受關注的架構發展趨勢,且非常適合於巨量資料的處理與儲存。更好的是,使用者環境不需了解雲端內部的作業環境或是硬體架構,便可利用網站或是應用程式的方式直接使用雲端環境的運算能力來完成使用者所要求的工作。由於在雲端環境上提供了許許多多的服務,只要有網路便可以充分地使用各式各樣的服務,使用者並不一定需要有昂貴而高速的硬體設備,只需要有可以連上網路的終端機便可。
目前基於雲端計算的平台及相關的服務越來越多,較為知名的服務有Google的App Engine、Microsoft的Azure、Yahoo的Hadoop及Amazon的EC2等等。其中Google的許多服務和Yahoo的Hadoop都使用到了一項雲端計算中相當重要的概念──MapReduce,此為Google提出的一個運算架構,適用於大規模資料集的平行運算技術。MapReduce的概念是將資料先做Map(映射)再Reduce(整合)起來,巨量的檔案會切割成數份小檔案分發給網路上的每個運算節點(Mapper),每個節點會獨立地執行所分配的工作,並周期性的把完成的工作和狀態更新報告回來,最後再將初步運算的結果根據指定的鍵(Key)整合,再次分給不同的節點(Reducer)以計算出最終的結果。
雲端計算吸引Google、Microsoft等大廠以及國內外名校積極投入相關技術研發。它所引發的強力風暴,加速產業鏈的成形,同時也創造更強力的運算資源。2007年10月,Google與IBM開始在美國大學校園推廣雲端運算的計畫,這項計劃希望能降低分散式運算技術在學術研究方面的成本,並為這些大學提供相關的軟硬體設備及技術支援,2008年1月30日,Google宣佈在台灣啟動「雲端運算學術計畫」,將與台灣台大、交大等學校合作,將大規模、快速運算的技術推廣到校園。各國政府也皆積極投入雲端運算產業的發展,企望能透過雲端運算服務提升政府效能,協助產業轉型與發展。
 |
圖二、PISAR系統的使用者介面示意圖。 |
|
本校元智大學亦不落人後,積極參與推廣雲端計算的工作,從2010年起先後執行了兩個大型計畫,首先是99學年度的大專院校資訊軟體人才培育推廣計畫-創新軟體人才培育模式推動(A類)之雲端計算與服務計畫,另外於100年1月到12月執行教學卓越計畫-風之塔的雲端冒險。在資工系黃依賢教授的帶領及相關同仁的合作努力之下,為了培育國內雲端計算的軟體人才,規劃了一系列的課程及講座,從基礎Java語言的學習到Android手機程式的教學,及雲端計算平台的Hadoop課程,都有不少學生積極的參與,課程的教材和上課影像都可於資工系的課程網站上下載;另外為了推廣雲端運算,在資工系館的地下實驗室,利用平常未使用的電腦架起了小型的私有雲,目前提供雲端計算的教學與研究環境之用。此外於2011年6月17日舉辦「雲端計算應用與發展」論壇(圖一),邀請到台灣大學劉邦峰教授、YAHOO奇摩研發經理蔡奕楷經理、趨勢科技林允溥顧問及國家高速網路與計算中心王耀聰副組長進行專題演講與綜合座談,共有計170位人員參與,本次論壇除了提升本校師生對於雲端計算應用的瞭解與視野,同時透過講座分享與研討交流,提供產官學各界人士交流與討論的機會。在接下來的一年內將會陸續舉辦雲端計算專案競賽與各項活動。
此外資工系KID(Knowledge Information
Discovery)實驗室由本人(黃仁暐)於98學年度起開始的專題研究計畫──漸進式資料庫與漸進式循序樣式探勘演算法之研發,99學年度的雲端環境中漸進式圖片搜尋推薦暨物件化自動標籤系統,以及100學年度的於多雲環境下資料傳輸保護與隱私保護之資料探勘技術,均於雲端計算領域有所研究,其中我們開發出一套PISAR系統,此為漸近式圖片與推薦系統(Progressive
Image Search And Recommendation
system)的簡稱,如圖二所示,PISAR主要是以標籤為基礎的圖片搜尋及推薦系統,改善人們對圖片中的事物及其所附帶的高階語意資訊的主觀認知偏差,對於以標籤檢索技術為主的系統所產生檢索的正確性之影響,並縮短高接與意與低階特徵之間之差異。當使用者在瀏覽圖片或點選查詢的圖片後,系統會自動將使用者查詢的關鍵字與所點選的圖片標籤作鏈結,藉此可經由與使用者的互動漸進式地修正對圖片的描述,進而改善搜尋的結果。然而為因應要儲存及處理網際網路上巨量的圖片、產生並管理龐大的標籤資料、分析圖片內容並產生視覺字組、記錄使用者的互動資訊並加以分析,這些都需要龐大計算資源來支撐系統的運作,所以我們導入雲端計算的概念,藉由分散式運算的特性,可於後端處理巨量的影像資料、所產出的巨量視覺文字組及標籤資訊,並開發分散式資料探勘演算法以提高處理及探勘上的效能。(http://pisar.cse.yzu.edu.tw)
雲端計算的技術與應用發展是未來十年資訊應用的新主流,各界均爭相投入雲端計算的規劃與研究,它具有低成本、高通用性、高擴充性、虛擬化、高可靠度等特色,適合用來處理巨量資料,這些優點正好是未來我們所面臨的資訊問題上最好解決方法。您還在等什麼?讓咱們一起漫步在雲端吧。