綜觀企業所擁有的眾多資訊,高達八成以上比重,皆屬於電子郵件、TXT文字檔、Excel、語音、照片、影像等非結構性資料,但藉由傳統IT技術,卻僅能處理另外兩成的資訊,也就是所謂的結構性資料。
這些結構性資料,通常被轉化為Table或記錄,留存於關聯式資料庫,並與多數應用系統相結合;譬如大家耳熟能詳的商業智慧(Business Intelligence,BI),正是以結構性資料為基礎,從不同維度產出分析結果,進而滿足企業經營管理需求。
僅佔兩成的結構性資料,被運用得如此徹底,但佔比達到八成的非結構性資料,迄今卻遲遲無法被系統化,使得企業難以體現箇中價值,因而構成兩大挑戰。首先,備受企業倚重的搜尋引擎,雖被視為挖掘資訊的重要工具,但僅能利用關鍵字搜尋,無法處理語音、圖片、影片等類型資料;其次則在無計可施之下,企業只好運用人工方式處理非結構性資料,但效率甚為低落,也無法善用資訊。
幸而透過Meaning Base Computing(MBC)技術的問世,使企業可望以各類型非結構性資料的「意義(Meaning)」與「情境(Context)」為基礎做分析,使得紛擾數十年始終無法突破的障礙,終於迎刃而解;因此MBC被喻為上世紀六零年代關聯式資料庫管理系統以來,最重大的革命性IT技術。
深究MBC的奧妙,在於有別於傳統IT技術的0與1處理模式,而能依據資料本身的型態(Pattern),去了解其含義,然後按照這含義,進一步做資料的處理與連結,使得企業原本無力處理的非結構性資料,開始可以被分析與萃取,產生非常巨大的效益。
巨大效益所為何來?透過MBC,有助於企業在大量非結構性資料當中,快速挖掘管理重點,在當前「快魚吃慢魚」的高度競爭環境中搶得先機,各行各業都可望因它而受益無窮。
譬如律師事務所,可根據當事人的語音陳述檔案,從過去累積數十年的資料中,迅速找出相關案例及判決書。高科技製造業,也可借助MBC,廣泛分析員工及郵件的內容,進而根據其中敘述或檔案的型態,自動比對出疑似洩露智慧財產權(IP)的跡象,隨即加以攔阻。企業的客服部門,則可依據客訴的語音資料或Facebook留言,研判產品可能存在之重大瑕疵,自動通知相關人員處理。從前述舉例看來,MBC是企業發展的過程中相當重要的致勝關鍵,值得關注。
(本文作者現任HP惠普科技應用系統服務部副總經理)