前言:尋找寫作靈感?中文期刊網用心挑選的網絡信息資源長期保存分析,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
[摘要]
網絡信息的快速增長與“易逝性”使各部門對網絡信息保存的需求變得必要和迫切。20世紀90年代中后期以來,國內外開展了一系列網絡信息保存項目。基于此,本文對網絡信息資源存檔(WebArchive)研究現狀進行了總結,希望檔案部門在網絡信息資源長期保存方面取得發展。
[關鍵詞]
網絡;信息資源;存檔
網絡信息以呈現隨機無序、爆炸式的指數增長,具有易逝性,網絡信息資源的大量流逝問題(網絡信息的存在周期為44天)引起了多方問題,如:教學中網址鏈接在使用時過期、網絡虛擬遺產糾紛、游戲系統消失造成玩家經濟和精神上的損失、人類社會的網絡歷史遺產的消失等問題,這些情況逐漸引起了各方關注。圖書部門在對網絡圖書進行管理時,也管理了網絡資源庫中的一次文獻、二次文獻、灰色文獻,通過對這些文獻進行數據庫建設并長期保存,隨后開始進行網絡出版物的保存和數據挖掘。創建信息資源或多種資源數據庫是一種數字資源的檔案化管理。這項工作做的比較好的是圖書管理部門,其還協同法律、經濟以及情報等多個部門參與工作,從而引起了多方對網絡資源的重視。
1網絡信息資源長期保存問題產生的背景
大數據時代,網絡信息資源多格式存在,多渠道、爆炸式產生和增長,這為社會生活多方面提供了信息便利。但網絡資源并不是任意獲取,而是分等級的被人們獲取,比如一次文獻、二次文獻或者灰色文獻,政府網站中的政令信息、個人博客等。通過應用和總結,網絡資源成膨脹式、難收集、難檢索、易逝性呈現并消亡,因此許多有價值的網絡信息資源亟待專人負責收集和保存。網絡資源的特點決定了人們開始重視網絡資源,重視對網絡資源的開發來發揮其應有的作用,從而在大數據環境下為知識管理、信息挖掘提供資源。現在任何人都可以制作信息,個性化和全民性的信息生產多樣化,已經無法控制。
2網絡信息資源長期保存概念的界定
易混淆的概念主要有兩個:一是客體方向,對客體界定的不明確;二是主體行為,即是主攻保存還是主攻利用。在客體方面,主要的表達方式集中在以下幾個關鍵詞上:數字資源、數字遺產、網絡信息資源、網絡資源。
2.1對客體概念辨析
數字資源是文獻信息的表現形式之一,是將計算機技術、多媒體技術和通信技術融合而形成的以數字形式、存取和利用的信息資源總和。簡單理解為基于計算機的信息資源總和。數字遺產是指互聯網上的數字文化遺產,即以互聯網為承載形態的文字作品、資料、圖片和影音形成一種文化傳承的遺產,也就是現在互聯網上的讀書頻道、文化頻道、博客、論壇、BBS以及空間等里面涉及的創作、記錄等內容。數字遺產——互聯網上的文章、資料、圖片和影音的保存,基本上都處于“不穩定”狀態,一旦遭到來自非用戶操作的刪除、更改,甚至商業網站虧損倒閉后,個人空間就會被注銷,內容就會受到不可逆轉的毀滅。網絡信息資源是指通過計算機網絡可以利用的各種信息資源的總和。其具體是指所有以電子數據形式把文字、圖像、聲音、動畫等多種形式的信息存儲在光、磁等非紙介質的載體中,并通過網絡通信、計算機或終端等方式再現出來的資源。網絡資源的外延更大一些,它除了信息資源外,還延伸到信息資源的引申資源,涉及關系網絡和社群網絡。而網絡信息資源更偏向情報信息,與通過互聯網獲取的信息資源相比較而言,網絡信息資源內涵于網絡資源,網絡資源是利用計算機系統通過通信設備傳播和網絡軟件管理的信息資源。
2.2對主體行為的理解
網絡信息資源存檔會同網絡信息資源長期保存這個概念相混淆。兩者是相近但不相同的兩個概念,雙方都涉及網絡資源以及網絡資源的長期存取,即有關信息的共享問題。但是網絡信息資源存檔(WA)更注重對網絡信息資源資源的建檔和檔案化管理。網絡資源存檔的內涵:有關主體有選擇性地對具有長遠保存價值的網絡信息進行捕獲、歸檔、存儲等檔案化管理過程,其基本目標是通過網絡信息資源的存檔,更全面、真實的反映和再現社會活動的本來面貌,并滿足相關主體對網絡信息的長遠利用需求。具體有以下四點:一是WA的目的是再現社會活動的本來面貌,實現網絡信息的長期保存和利用。二是WA的行為主體具有多樣性。三是WA行為具有高度選擇性。四是WA的行為程序具有規范性。筆者更傾向將WA定義為一種對網絡信息資源檔案化管理的行為。學界網絡資源存檔的理解還有:認為WA是一種對網頁進行網頁快照的行為。筆者認為網頁快照無法滿足多種格式的要求,目前視頻和視頻直播已成為網絡較火的一種信息資源,這就是網頁快照無法做到的。
3檔案部門應對網絡信息長期保存的措施
3.1從國家戰略層面重視
從國家宏觀戰略方向看,筆者認為國家檔案部門應采用頂層設計,統一領導,分層管理的方式來建設我國的網絡信息資源保存項目。同時,對國外具有保存價值的網絡信息資源有選擇性的進行保存和研究。
3.2在政策上進行探索
當前,檔案信息化建設也將許多檔案信息資源上傳到網絡上,因此,這就更加給網絡信息資源的保存增加了壓力。政策上的保障是其前提,也是指引方向的引路燈。下面提出一些筆者的建議。從內容上,可借鑒我國臺灣地區的WebArchive做法,臺灣網絡典藏項目針對各級政府網站、教育及學術機關網站(研究機構、社會教育機構及大專院校及所屬系所網站)、圖書館網站(各大專院校圖書館、專門圖書館、公共圖書館、圖書咨詢學研究單位及圖書館團體網站)、重大社會議題網站(以政治、經濟、文化等各個領域社會重大議題為向導,收藏與該議題論述相關的網站,如:環境保護、教育改革、媒體改革、金融改革、土地規劃、全民反恐以及公民投票等)構建了一個龐大的、體系化的政府工作網絡,該網絡更便于政府各部門之間的互聯、互通,在提高效率的同時,更好的服務群眾。從格式上,通過對文字格式、視頻、音頻、游戲服務器等的保存,進行項目編目,除采用存儲器陣列等方式,還可以開發新型存儲器等。這些可以學習國外先進科技,也可以參考其他國類似的項目。
3.3在運行中尋求協作
網絡信息資源存檔保存,既需要檔案部門率先引領,同時也需要計算機技術部門的配合,技術難題是攻堅克難的關鍵。不僅如此,法律、標準、政策、企業等都需要協同進來。因為這一項目的成功應用,將會對社會生產和管理、經營帶來不小的變革,因此需要這些部門共同努力。
4網絡信息資源長期保存存在的問題
4.1對WebArchive的重視和認識程度不足
許多游戲網站在運營十多年后,往往面臨關閉服務器的境況。而該服務器的玩家卻還在享受游戲帶來的樂趣,當關閉服務器后,這類資源將面臨永遠消失的狀況,如果WA項目忽視了此類資源,是否是對人類遺產的一大缺失。在21世紀的某些階段,人類行為缺少了合理的解釋,是因為未對當時網絡信息資源的原生資源進行存檔保存。因此,重視和重新認識網絡信息資源,并對其進行檔案化保存是一種對全人類記憶負責的表現,這些只是筆者了解到的某一種情況。對于政府機構、企事業單位來講,都建設有自己的網站,對網站內容會進行及時更新,做好宣傳,同時單位內部的業務也會通過網站進行溝通,這些原生的網絡信息資源若不加以及時保存,待到查考時,將無從下手。
4.2資金投入少
技術和管理的革新,資金投入是硬性指標。只有大量的資金支持,才能在硬件更新上配備最好的設備。對于企業或政府而言,這類投入想要在短期內盈利,怕是很困難的。通常這種投入都伴隨著時間而增長,很少有投資者能夠具有前瞻性的看到長期投入對整體運作的意義,許多投資者和決策者很難做到有前瞻性的去審視對本企業的信息資源進行投入,更難看到這種投入的回報在生產和經營領域的貢獻。
4.3技術含量低
網絡信息資源存檔保存所應用的計算機軟件和開發軟件形成的系統平臺伴隨著IT技術的不斷翻新,需要不斷更新。但是這目前在我國很難做到,因為許多檔案尚屬于國家非盈利部門,屬于經營性企業的檔案和網絡信息資源也很難獲得企業和部門的資金投入,這樣就更難獲得技術投入,許多部門的檢索功能還停留在人工紙質和手動階段。在技術方面我國較國外稍弱一些,但相信在借鑒他國發展歷程并進行我國自主研發后,技術問題將迎刃而解,且指日可待。
4.4歸檔權限模糊
法律責任分配問題探討至今尚無定論,相關人員需進一步同法律部門進行研究討論。
作者:孫輝 單位:遼寧省水利水電勘測設計研究院
主要參考文獻
[1]謝歡,鄭永田.數字遺產保存:圖書館義不容辭的使命[J].圖書館論壇,2012(4).
[2]耿磊.對網頁信息資源長期保存的若干思考——InternetArchive和WebInfoMall項目的啟示[J].湖北檔案,2012(2).
[3]黃峒勝.網絡信息保存運動對我國圖書館建設的啟示[J].圖書與情報,2010(6).
[4]周佳貴.美國數字信息保存計劃——NDIIPP及其對我國的啟示[J].圖書館工作與研究,2006(1).
[5]周毅.網絡信息存檔:檔案部門的責任及其策略[J].檔案學研究,2010(1).
[6]周毅.論網絡信息存檔權及其生成[J].中國圖書館學報,2011(1).
[7]趙俊玲.挪威網絡信息保存項目Paradigma[J].山東圖書館季刊,2004(3).
[8]謝春林.英、美、澳、挪網絡信息保存政策的經驗與借鑒[J].情報資料工作,2009(6).
[9]張小芳.數字信息資源長期保存體系研究[J].四川圖書館學報,2011(5).
[10]臧國全,田莉.數字保存供給與需求的影響因素解析——基于集體創作型Web數字資源保存的實證研究[J].圖書館理論與實踐,2011(1).
[11]肖琬蓉.信息資源數字化建設質量控制研究[J].圖書與情報,2010(5).
[12]何朝暉,戴龍基,肖瓏.共建共享數字資源的可持續利用研究[J].大學圖書館學報,2007(2).
[13]郭家義.數字信息資源長期保存系統的標準體系研究[J].現代圖書情報技術,2006(4).
[14]陳清文.網絡信息資源保存研究綜述[J].山東圖書館季刊,2006(1).
[15]孫紅娣.論開放存取中的數字資源長期保存問題[J].圖書館學研究,2005(11).
[16]賴朝新.數字信息長期保存的主體研究[J].圖書館理論與實踐,2005(2).
[17]宛玲,吳振新,郭家義.數字資源長期戰略保存的管理與技術策略——中歐數字資源長期保存國際研討會綜述[J].現代圖書情報技術,2005(1).
[18]鄧富民.基于服務質量差距模型的服務質量特性構成分析[J].四川大學學報:哲學社會科學版,2004(5).