瀏覽器背後隱藏的秘密
壹、引言
隨著網際網路的快速發展,網路應用程式的便利性促使人們的生活更離不開網路世界;不論是在網際網路上搜尋資訊或是在facebook等社交網站上與朋友聯絡感情,要完成這些工作都少不了瀏覽器的協助,實可見瀏覽器之重要性。既然瀏覽器對人們的日常生活是如此息息相關,密不可分,您是否知道在使用瀏覽器瀏覽網站的同時,您所使用的瀏覽器亦同時記錄了有關您個人的資訊在您所使用的電腦中。在個人隱私保護逐漸獲得重視的時代,瀏覽器在我們瀏覽網頁的過程中到底記錄了哪些資訊,是你我都應該投入時間關心和了解的重要議題。
為了提升執行效率與便利性,瀏覽器在使用者瀏覽網頁時,除了從網頁伺服器取得要求的網頁外,同時也會為使用者在網路上的行為活動寫下紀錄,如此,瀏覽器才能更了解每一位使用者的使用習慣及個人喜好,以提供個人化貼心的小功能,讓使用者在瀏覽網頁時可以不用重複輸入相同的資料。例如,瀏覽器會主動將您經常瀏覽的網址記錄下來,日後您可以直接從網址列的下拉式選單裡點選相同的網址;或者當您登入網站時,瀏覽器可以幫您記錄帳號密碼,並且在您下次瀏覽該網站時自動填入。
瀏覽器功能雖然方便,卻也間接地將使用者的個人資訊直接攤在陽光下,例如自動記憶帳號密碼的功能,讓使用者省去記憶的麻煩,然而個人資料儲存在瀏覽器裡卻又增加個資外洩的風險。使用者要如何享受瀏覽器帶來的便利性,又同時能保護個人的隱私資訊,就必須了解瀏覽器記錄了哪些使用者的個人資訊,而這些資訊又存放在哪裏。
貳、了解瀏覽器儲存的資料
瀏覽器記錄的使用者瀏覽資訊,以 Internet Explorer (IE)為例,介紹說明如下:
一、index.dat
由於瀏覽器儲存在作業系統裡的使用者瀏覽資訊,是以使用者「瀏覽過的網頁網址」、「cookie」及「瀏覽器的網頁內容暫存檔」等為分類,並分別存放在不同的資料夾裡,因此作業系統需要索引表才能索引找出資料正確的存放位置,而這個表格就是index.dat;每一個記錄使用者瀏覽資訊的資料夾裡都有一個index.dat檔,供作業系統查詢檔案正確的存放位置與檔案名稱。index.dat檔案與瀏覽器存放使用者瀏覽資訊的檔案儲存路徑,整理如下表1。
以網頁內容暫存檔為例,在使用者第一次瀏覽某一網頁時,瀏覽器會暫存該網頁圖文內容,並存放在「Content.IE5」的子資料夾(由作業系統隨機命名)中,然後把暫存網頁的索引資訊,包括網址、存取時間、檔案名稱及儲存路徑等資料寫入index.dat中。每當使用者重複瀏覽相同網頁時,瀏覽器會去查詢index.dat檔,以正確找到先前儲存的暫存檔。因此瀏覽器就只有在使用者第一次瀏覽某一網頁或網頁內容已有修改變更時,才需要連線到伺服器端把網頁下載回來。如圖1,「Content.IE5」資料夾即是暫存網頁與index.dat檔的存放位置。
二、網頁內容暫存檔
為節省屢次從網頁伺服器取得網頁所須額外花費的時間與網路頻寬,瀏覽器會在使用者第一次瀏覽某網頁時,自網頁伺服器取得網頁後,將文字、圖片及多媒體檔案等網頁內容另儲在使用者的電腦裡;網頁暫存檔確切的存放位置如圖1所示。日後,若使用者想要重新瀏覽的網頁並未做更新或修改時,即網頁內容與上次瀏覽的內容沒有差異,瀏覽器便僅會自使用者電腦中的備份讀取該網頁而非再次連線到原來的網頁伺服器,這也就是為什麼使用者在一開始開啟某一網頁時,可能要等上些許的時間,全部的網頁內容才會完整地展現於瀏覽視窗上,以及雖然使用者隨後也瀏覽了其他網頁,但點選「上一頁」按鈕時,之前瀏覽過的網頁卻能馬上完整地呈現在使用者面前的原因了。值得注意的是,瀏覽器備份暫存網頁內容雖然為使用者省去等待網頁開啟的時間及網路頻寬,然而我們免不了會使用瀏覽器開啟webmail等收發電子郵件或進行線上購物,而這些敏感程度較高的個人資料,亦同時會備份存放在使用者的電腦上。
圖1 網頁內容暫存檔存放路徑
圖2 cookie存放路徑
三、Cookie
Cookie 是使用者瀏覽網頁時,由網頁伺服器傳送至使用者系統存放的純文字檔案,伺服器可以透過cookie存放任何資料於瀏覽者的主機裡;這些資料可以幫助網頁伺服器用來識別網站瀏覽者是不是第一次瀏覽該網站,或追蹤使用者網頁瀏覽情況以了解瀏覽喜好。網站要確認使用者身分以提供「個人化介面」、「客製化廣告」等等功能,在身分驗證的過程中,具識別功能的cookie即扮演相當重要的角色。
這些伺服器端傳送至使用者電腦的cookie又分成二類,一種是session cookie,另一種是persistent cookie;session cookie 在使用者關閉瀏覽器時即會被清除掉,而persistent cookie,則會留在使用者電腦裡。這些cookie資訊都儲存在「cookies」資料夾中,如上圖2。
一般而言,伺服器會將cookie裡的資料加以編碼,因此,cookie內除了產生此cookie 的網域名稱(domain name)與時戳(time stamp)等資訊以明文表示外,其他資料個別代表的意義,僅有發送該cookie的伺服器知道如何解析,以解讀成真正的資訊,如圖2所示。
從網域名稱我們可以得知cookie的來源,時戳則能得知cookie的建立時間;然而並不是每個網站都會將資料編碼,因此未編碼的cookie就有洩露個人資訊的風險存在。由於大多數的網站將cookie做為識別瀏覽者身分的工具,善意的運用,可省去許多重複輸入資訊的不便,卻不得不防範cookie若被有心人士竊取所引發的身分盜用問題。
四、瀏覽歷史紀錄
IE會將使用者瀏覽過的所有網址記錄在index.dat裡,這些紀錄會依瀏覽日期分類,供使用者檢閱,如圖4。使用者的瀏覽紀錄依日期區分成5個群組,每個群組內記錄著使用者在該時間區間內的瀏覽紀錄。此項功能對使用者而言,最大的優點在使用者可以利用網頁部分標題名稱或網頁瀏覽時間,搜尋想要再次瀏覽的網頁。
圖4 依時間區分的使用者歷史瀏覽紀錄
圖5 使用者歷史瀏覽紀錄
每一筆歷史瀏覽紀錄會記錄瀏覽的網頁網址、標題及瀏覽時間,如上圖5所示。使用者什麼時候瀏覽過哪一個網頁、搜尋過哪些資料,在歷史紀錄裡一覽無遺。
參、結語
瀏覽器雖然會蒐集使用者的瀏覽紀錄,不可諱言,這些紀錄的用途確實為使用者增加了不少便利性。然而個人隱私資料蒐集的動作就像雙面刃一樣,為使用者帶來方便的同時,卻也潛藏洩漏使用者個人隱私資訊的隱憂;蒐集的資訊倘若是存放在使用者個人電腦裡,或許無傷大雅,然而,要是哪一天同事借用您的電腦,又或者您所使用的是公用電腦,您是否才意識個人瀏覽紀錄對您個人隱私的重要性與敏感程度。雖然如此,資訊時代瀏覽器扮演的角色有多重要,可從Google 積極發展Chrome以加入瀏覽器市場戰局,並且於近期發表與瀏覽器極為相似的Google Chrome OS,皆可看出瀏覽器對未來資訊時代絕對是扮演舉足輕重的重要角色。我們不可能因噎廢食,不再使用瀏覽器,真正的解決辦法在於使用者要學會如何操作這項利器,善用其優點,才能徜徉於無盡的網路世界,同時保護自我的隱私。
資料來源:法務部調查局
0 意見: