網路上雖然可以找到許多網站存取流量的分析軟體,但是大多數的網站管理員還是會在主機上自行架設網頁分析工具,因為這樣才能保有掌握權。本文所要介紹的便是一套從Webalizer分支後再自行發展的網站紀錄檔分析工具—AWFFull。其輸出結果類似於Webalizer,但是提供了更多的功能。
網際網路發展至今,即使撇開ARPANet時期的草創階段不算,也已經有了將近二十年的歷史。如果要所有人進行投票,表決網際網路出現至今最重要的發明或應用技術,相信全球資訊網即使拿不到第一名,至少也會在前三名之內。原因相當簡單,因為從全球資訊網出現後,全世界的資訊與知識交換速度是先前的數倍以上,甚至呈現級數上升的趨勢。全球資訊網的重要性如此之大,自然也成了各行各業相當重視的網路服務。時至今日,即使是個人工作室都可能擁有官方網站,對於一般的企業而言,全球資訊網更是不可或缺的網路服務之一。
AWFFull軟體小檔案 |
軟體版本:3.10.2
軟體性質:General Pubic LICENSE(GPL) v3+
使用限制:無
官方網址:http://www.stedee.id.au/awffull
下載網址:http://www.stedee.id.au/files/awffull-3.10.2.tar.gz(1.0MB) |
▲AWFFull官方網站 |
企業追求的是獲利,公司股東期望的自然是投資到公司的每一分錢都能盡其所能地為公司帶來利潤。雖然架設網站對於公司而言應該是服務性質的工作,但如果無法了解公司網站是否可以有效吸引人潮,這樣的資金使用方式自然需要有所改變。也許是網站本身的外觀不夠引人注目,或是網站提供的資料不夠豐富。
此外,一般使用者或是潛在的客戶是否能透過特定關鍵字輕易找到公司網站,也會是網站設計上的一大重點。如果公司網站所提供的資訊並不是社會大眾或消費者所需要的,與其浪費金錢與頻寬在一個沒有實質效益的網站上,不如趕緊調整網站走向或是資訊內容,才能夠讓架設網站的成本轉化為公司的獲利來源。
如何了解網站所提供的資訊是否為使用者所需要的內容,自然不可能針對全國甚至全世界發送問卷進行調查。網站的架設者或管理者,可以自行到網路上搜尋相關資訊,了解目前網路世界中眾人所需要的資訊為何。除了這種主動出擊的方式之外,消極一點的網頁存取資料分析也是相當重要的一環。雖然使用資料分析的方式有些被動,但這也是相當重要的參考資料來源。因為管理者可以查閱使用者最常存取的資料有那些,針對此部分進行加強。至於大多數人不感興趣的部分,則可以直接移除或是減少此方面的版面。
如今在網路上已經可以找到許多網站存取流量的分析軟體,也有專門提供此種服務的公司存在,甚至還有像Google Analytics這種免費的網站流量分析工具可以使用。雖然已經有免費的網站分析工具的存在,但網站管理員通常還是會傾向於在主機上自行架設一套網頁分析工具。因為大多數的網頁分析工具都是採用開放原始碼的方式釋出,如果在功能上稍有不足,具有程式設計能力的管理員也能夠自行修改軟體,無須仰賴他人協助。
許多網站管理員都聽過Webalizer這套網路流量分析工具,本文所要介紹的便是一套從Webalizer分支後再自行發展的網站紀錄檔分析工具—AWFFull。乍看之下,AWFFull的輸出結果相當類似於Webalizer,但是AWFFull提供了更多特色,而這一部分正是知名的Webalizer所欠缺的。如果已經在系統上架設Webalizer,或許也可以考慮再加上一套AWFFull,以彌補Webalizer的不足。
|
▲AWFFull的使用介面與Webalizer非常相似 |
存取容易
與Webalizer相同,AWFFull都會在分析網頁伺服器的紀錄檔之後,產生一系列的HTML網頁供使用者參考。這些網頁都會整合文字、表格與圖案,讓使用者可以輕易了解網站流量的大致使用情況。也因為這些報表檔案都是以HTML的形式呈現,所以無論使用者採用何種瀏覽器,或是慣用的作業系統是否為主流產品,都不影響查閱流量報表的使用過程。無須額外設定,也不需要特地準備或安裝任何軟體。
報表區隔
從3.9.1版開始,AWFFull便提供了一些基本的報表區隔功能(Segmentation)。報表區隔功能指的是資料統計時使用一個或多個特徵,將所有的分析資料區別開來成為特定的群組或區塊,其目的是希望將該區塊未來的價值最大化。由於進行資料分類時會依照不同的屬性進行,所以無論使用者想要查詢來訪者的地理位址或是年齡分佈的情況為何,都能在最短的時間內找到所需的資料。AWFFull的報表區隔功能可以直接在命令列參數內指定,亦可在設定檔中進行。經由這樣的操作方式,使用者可以非常輕易地了解網站內容被使用的方式,並可針對不足之處進行加強。
區隔功能看起來似乎並不是非常複雜的設計,但事實上這是相當強大的資料分析技術,而且讓網站可以提供更多功能來服務有需要的使用者,據筆者的瞭解,就這方面來說,AWFFull是第一套,也是目前為止唯一提供區隔功能的開放原始碼網頁紀錄檔分析工具。
|
▲報表檔案採用標準的HTML格式,無須另行準備其他軟體即可存取 |
眼球分析
AWFFull從3.8.1版開始,在報表中加入大量的比例表格與度量結果,以輔助使用者立即觀察出站台運作的情況以及所缺乏的部分。由於這樣的輸出格式設計相當明確,幾乎只要動一下眼睛就能觀察到大部分報表的重點,所以被稱為「眼球分析」。
有些網站紀錄檔分析程式,雖然提供許多功能,但在外觀設計上並沒有做到這樣的模式,不免讓人覺得有些不切實際。從這裡便可以看出,AWFFull不僅僅只是超越一些計數程式而已,還接觸到網站分析工具的精髓所在。
|
▲文字表格與圖形的雙重顯示,可以在查詢資料時快速找到需要的統計數據 |
顯示超過十二個月份的資料
部分網站分析工具在設計之初,因為只考慮到使用者需要比對月份與月份之間的資料,而沒有顧及使用者可能也有比對年份與年份之間資料的需求,所以在顯示畫面的設計上只提供十二個月的資料統計圖表。在大多數的情況下,這種設計方式並不會造成太大問題,但如果希望進行更長時間的資料比較與分析,此種設計方式的缺失就會立即呈現在使用者面前。
為了提供更好的功能,並且讓使用者有更方便的資料比對選擇,AWFFull提供了超過十二個月的資料比對功能。雖然這樣的功能只套用在最前面的總結表格與圖表之中,但至少還有顧及特殊需求的使用情況,也多了一種功能上的彈性選擇。
CSS樣式表的支援
統計表格的外觀通常是固定不變的,如果要修改報表的輸出格式,以往可能需要進行網頁樣板的修改,甚至還可能得修改程式本身的原始檔。AWFFull則提供了CSS樣式表的支援功能,如果使用者不滿意預設的報表外觀,可以利用CSS樣式表輕易完成報表輸出的樣式修改動作。由於採用了CSS方式進行輸出網頁的設計,所以使用者在修改這些網頁時,不需要花費太多的工夫,時間上也相對地快速許多。
|
▲如果對輸出報表的顯示方式不滿意,也可以使用CSS樣式表進行修改 |
可調整大小的圖表
在需要比對或輸出較多資料的情況下,例如一次進行數個年度資料的比對動作,很可能會讓報表網頁上所產生的圖片因為放入過多資料而顯得擁擠,甚至會因為資料量太大而讓圖片變得不容易閱讀。AWFFull為了解決這樣的問題,提供了可自訂化的圖片大小設定功能。使用者可以將許多圖片設定成以較大尺寸輸出的方式,讓追蹤長達數年以上的資料顯得更加容易。由於只需要修改設定檔即可完成相關動作,所以使用者不必修改程式,也不用擔心過程會變得相當複雜。只須修改設定檔的特定欄位,便可輕鬆完成。
國際化支援
大多數的網站資料統計軟體都是歐美人士所設計的,所以輸出結果的頁面通常會使用英文,有的軟體甚至只支援當地語系,而不考慮其他國家的使用者是否能看懂這些訊息。截至目前為止,AWFFull支援32種不同的語系,大多數主流的語言都已經完成翻譯並隨著主程式同時釋出。
除此之外,AWFFull的開發團隊也同時徵求更多志工的加入,以便完成更多的語系翻譯檔案。由此看來,AWFFull將來會支援更多的語言,以達到軟體國際化的目標。
|
▲預設使用英文的AWFFull,亦支援多達32種各國語言 |
自動化紀錄檔格式偵測
先前有架設過其他紀錄檔分析軟體的使用者,一定經歷過需要修改網頁伺服器紀錄檔格式以便符合分析軟體需求的過程。也許部分使用者並沒有修改過網頁伺服器的紀錄檔格式,而是以修改分析軟體設定檔的方式加以取代。無論是那一種方法,或多或少都有些許不便之處。因為並不是每個人都能理解紀錄檔格式的使用方式,很可能在設定過程中發生問題,連一筆分析資料都無法順利產生。
為了解決這樣的問題,讓生活可以過得更加容易與充實,AWFFull提供了自動偵測紀錄檔格式的功能。目前AWFFull可以支援五種檔案格式,包括CLF、Combined、Squid、FTP XFER與Domino v6等等。其中,CLF與Combined為Apache網頁伺服器中最常使用的二種紀錄檔格式,如果使用者不了解該如何判斷紀錄檔格式,直接將此工作交給AWFFull代為進行即可。
執行快速
紀錄檔分析軟體在運行一段時間的機器上執行時,很可能會因為資料量過於龐大而花費相當長的時間來產生報表。也許這樣的等待時間只是短短的一、二分鐘,但對於大多數人而言,能夠以最短的時間產生最正確的報表,當然再好不過了。
雖然AWFFull並不是目前世界上運行效能最快速的紀錄檔分析程式,目前也只是朝著這個目標邁進的階段而已,但AWFFull在執行速度上的確有其獨到之處。依據官方統計資料顯示,在使用AMD X2 4400處理器的情況下,AWFFull可以在每一秒鐘進行超過七萬行資料的處理與分析動作。由於AWFFull的執行速度相當快速,所以在需要進行數個年度的資料比對動作時,也能夠在相當短的時間內完成所有分析過程,並產生正確的報表檔案。
|
▲AWFFull的執行速度相當快,一秒鐘可處理七萬筆左右的資料 |
GeoIP來源國家偵測技術
網際網路所使用的IP位址,在分配時因為都有記錄使用範圍與使用者的國家名稱,所以理論上只要建立一個查詢用途的資料庫,即可經由IP位址得知前來使用網站的訪客所屬的國家為何。
大多數的網頁管理員多半都想了解自己的網站是否可以吸引國外人士的注意,尤其是潛在客戶散佈在世界各地的公司行號更加在意。網路上有一些常見的工具程式可以提供類似的查詢功能,例如Linux系統中的nslookup指令即為一例。只是工具程式的輸出訊息並不見得可以直接在程式中使用,通常都需要另外處理才行。
AWFFull為了提供來源國家偵測技術,整合了MaxMind所設計的GeoIP API,可以提供相當正確的國家偵測功能。AWFFull本身也有提供國家偵測功能,但如果採用了GeoIP,在此方面的表現將更加正確,也可提供較為正確的報表資料。
|
▲AWFFull也提供來源國家偵測功能,如果配合GeoIP API,則可以提供更正確的來源國家統計資料 |
GeoIP並非安裝AWFFull所必需的條件之一,屬於選用功能。雖然不是必要安裝的元件,但如果將GeoIP與AWFFull進行整合,對於網頁紀錄檔的分析結果,將可以提供更多具有參考性的資料。
AWFFull的安裝需求
AWFFull在安裝時需要先行安裝至少四個額外的程式庫,但這些程式庫都相當熱門而且經常在Linux系統上被其他軟體採用,所以很可能系統上早已安裝了這些程式庫,而不必另行安裝。這些程式庫包括了GD圖形程式庫、PCRE程式庫(Perl相容的正規表示式程式庫)、libpng影像程式庫以及zlib壓縮程式庫等等。
使用AWFFull時,若遇到圖片上無法顯示任何文字的問題,很可能是使用了不正確的外部程式庫元件,例如某些簡化版本的GD程式庫並不支援TrueType字型,因此無法處理文字顯示的功能。
AWFFull的安裝與大多數的Linux應用程式類似,只要幾個步驟即可完成。在確認過系統已經安裝過上述的必要程式庫之後,使用下列指令即可進行安裝作業。
tar zxpf awffull-3.10.2.tar.gz
cd awffull-3.10.2
./configure
make
sudo make install |
AWFFull是以設定檔的方式來決定運作模式,為了幫助使用者快速上手,也提供了兩個設定檔的範例。其中sample.minimal.conf是以AWFFull最基本的功能為主,了解此設定檔的內容即可大致理解AWFFull的運作模式與基本功能。
而sample.conf則提供了AWFFull所有支援的設定選項,並附上相關說明供使用者參考。一般都建議使用者參考這二個範例設定檔,再從中修改出自己所需要的功能。
|
▲AWFFull提供二個設定檔範例,可作為參考資料使用 |
AWFFull預設使用「/usr/local/etc/awffull.conf」作為設定檔的來源。如果此檔案存在的話,便會直接使用此設定檔的內容執行AWFFull。
如果使用者想以其他設定檔執行AWFFull,則可以使用「awffull –c /path/awffull.conf logfile.log.gz」的格式進行。從這樣的執行範例中可以發現到,AWFFull除了可以處理一般的紀錄檔之外,對於系統上已經被自動壓縮的紀錄檔也能加以處理。這樣的功能在需要比對現有資料與舊資料時相當有用。
結語
許多人可能會覺得已經有了Google Analytics,或是像Webalizer如此知名的網頁紀錄檔分析程式,應該不需要再安裝AWFFull。AWFFull雖然是從Webalizer分岐而來,外觀看起來也有些相似,但提供了比Webalizer更多的功能,還是相當值得一試。至於Google Analytics之類的外掛分析程式,功能雖然強大,但畢竟掌握權不在自己手上。如果想要擁有較為彈性化的分析程式,還是得自行安裝才好。