電 話:18937133779
網(wǎng) 址:http://www.cytv37.com
郵 箱:zboao@qq.com
檔案網(wǎng)站是檔案部門向廣大利用者提供檔案信息服務(wù)的重要途徑,檔案網(wǎng)站具有豐富的檔案信息資源,這些檔案信息資源以網(wǎng)站文件的形式存在于網(wǎng)站之中。網(wǎng)站文件是在網(wǎng)站中形成的、具有原始記錄性的電子文件,包括網(wǎng)頁、后臺數(shù)據(jù)庫文件、程序文件等。對于傳統(tǒng)紙介質(zhì)可以通過館藏保存,而動態(tài)網(wǎng)頁信息隨著時間的推移,電子文件在不斷變化、增長,很多當(dāng)時的網(wǎng)頁,就再也找不到了。我國還沒有網(wǎng)站信息歸檔的操作指南或指導(dǎo)性規(guī)范,大量網(wǎng)站信息處于自生自滅的狀態(tài)。作為檔案部門在信息化發(fā)展迅速的今天,加強檔案網(wǎng)站歸檔工作已經(jīng)刻不容緩。
加強檔案網(wǎng)站歸檔具有非常重要的現(xiàn)實意義。網(wǎng)站文件更新快、壽命短,具有很強的動態(tài)性,不及時歸檔整理,這些記錄也將不復(fù)存在,及時對網(wǎng)站歸檔是保護網(wǎng)絡(luò)信息資源的需要。當(dāng)前,各級檔案網(wǎng)站通過政府信息公開向公眾提供信息服務(wù),以保障公眾的知情權(quán)和監(jiān)督權(quán),收集網(wǎng)站上對國家和社會有保存價值的記錄,是國家檔案行政管理部門的職責(zé)所在,也是互聯(lián)網(wǎng)時代檔案部門面臨的新課題。
現(xiàn)階段信息化發(fā)展為檔案網(wǎng)站歸檔的實現(xiàn)提供了有力的技術(shù)支撐。網(wǎng)站歸檔要最大限度保留實時網(wǎng)頁特征,歸檔后實現(xiàn)網(wǎng)站的全部功能,保留網(wǎng)站上的結(jié)構(gòu)、內(nèi)容。在進行網(wǎng)頁歸檔時,應(yīng)參照國家有關(guān)電子文件管理相關(guān)要求。前端控制是電子文件歸檔保存的基本原則,對于動態(tài)網(wǎng)站文件來說尤為重要,這就要求網(wǎng)站建設(shè)初期就要根據(jù)網(wǎng)站數(shù)據(jù)特征制定歸檔保存方法,這樣隨著網(wǎng)站改版、更新,大量的網(wǎng)站電子文件才能做到繁而有序。另外,網(wǎng)站的歸檔時機要選擇在網(wǎng)站發(fā)生較大變化時,這樣可以記錄重要節(jié)點網(wǎng)站原貌?,F(xiàn)階段,我國主要的檔案網(wǎng)站根據(jù)網(wǎng)頁電子文件的特征主要有靜態(tài)頁面、數(shù)據(jù)庫兩種類型。根據(jù)網(wǎng)站類型網(wǎng)站文件的保存方式我們可以采用對象驅(qū)動法、事件驅(qū)動法和網(wǎng)站快照法來進行網(wǎng)頁電子文件歸檔。
對象驅(qū)動法適用于靜態(tài)頁面的網(wǎng)站歸檔,主要是按照改版和時間,如周、旬、月定期建立網(wǎng)站鏡像。這類網(wǎng)站基本使用網(wǎng)頁生產(chǎn)系統(tǒng)制作網(wǎng)頁后自動傳送至網(wǎng)頁服務(wù)器,傳輸網(wǎng)頁文件同時可以定期自動將實時網(wǎng)站文件按照時間節(jié)點制作網(wǎng)站鏡像,將網(wǎng)站內(nèi)容全部拷貝到硬盤、光盤、磁帶等存儲器中脫機保存。滿足實時網(wǎng)站歷史原貌的要求,但它的成本較高。網(wǎng)站的每一次更新、改版導(dǎo)致內(nèi)容發(fā)生變化,都要做一次鏡像備份,盡管現(xiàn)在的存儲價格低,但隨著時間網(wǎng)站備份數(shù)據(jù)增大,購買存儲設(shè)備的資金支出就會越來越大。
事件驅(qū)動法適用于使用較多動態(tài)網(wǎng)頁技術(shù)的網(wǎng)站,動態(tài)網(wǎng)頁一般都有后臺數(shù)據(jù)庫做支持,具有很強的交互性,網(wǎng)頁會根據(jù)用戶的要求和選擇而動態(tài)改變和響應(yīng),用戶可以在網(wǎng)站上咨詢、留言。動態(tài)網(wǎng)頁都是通過數(shù)據(jù)庫自動生成新的頁面,無須手動更新,訪問者通過瀏覽器調(diào)用網(wǎng)頁服務(wù)器的數(shù)據(jù)庫來訪問網(wǎng)頁。這類網(wǎng)站網(wǎng)管人員定期將數(shù)據(jù)庫文件進行完整備份。這種方法網(wǎng)頁中的靜態(tài)頁面基本不變,變化的是不同的數(shù)據(jù)庫中的表,訪問者通過訪問指定時間的數(shù)據(jù)庫就可以查詢到過去某個時刻網(wǎng)站的電子文件。這種方法需要存儲多個時間節(jié)點的數(shù)據(jù)庫并建立索引,這就要求網(wǎng)站管理人員具有較高的計算機專業(yè)技能。
網(wǎng)站快照法是在特定時間對網(wǎng)站上數(shù)據(jù)對象進行完整且準(zhǔn)確的拷貝,它捕獲了網(wǎng)站的內(nèi)容、格式和技術(shù)特征。展現(xiàn)出了網(wǎng)站在某一時間點的畫面,對于單獨的一份快照來講,它是孤立的,只有和其他的快照聯(lián)系在一起才能重現(xiàn)網(wǎng)站,為保證快照之間的連續(xù)性,需建立快照目錄,即快照的變化日志來跟蹤記錄站點的變更。對于更新不頻繁的網(wǎng)站,可以采用此方法,在網(wǎng)站內(nèi)容更新或改版時做一次網(wǎng)站快照并對其進行維護。網(wǎng)站快照的缺點是要借助現(xiàn)有的搜索引擎(如百度、谷歌等)來抓取網(wǎng)站數(shù)據(jù),然后對網(wǎng)頁進行緩存處理后存儲在本地服務(wù)器中,如果自己開發(fā)搜索引擎的成本是網(wǎng)站所有者無法承受的。
網(wǎng)站網(wǎng)頁歸檔是近年來政府上網(wǎng)工程和電子政務(wù)發(fā)展帶來的一項新的工作任務(wù),目前沒有統(tǒng)一的標(biāo)準(zhǔn),網(wǎng)頁歸檔涉及太多的問題,有些問題目前尚無完好的解決方案。作為檔案網(wǎng)站的建設(shè)者應(yīng)進行多方位探索,并在探索中不斷完善。近幾年,國家檔案局對此也在進行探討和研究,相信不久將會啟動各級檔案網(wǎng)站網(wǎng)頁存檔工作,將網(wǎng)站納入本單位電子文件歸檔范圍,把檔案網(wǎng)站網(wǎng)頁保存好、記錄好。