電 話:18937133779
網(wǎng) 址:http://www.cytv37.com
郵 箱:zboao@qq.com
文書檔案數(shù)字化公司:大數(shù)據(jù)、區(qū)塊鏈等信息技術(shù)的不斷發(fā)展,為文書檔案數(shù)字化管理提供了堅實的技術(shù)支撐。然而當(dāng)前文書檔案管理對于信息技術(shù)的應(yīng)用尚處于初級階段,無法充分發(fā)揮數(shù)字化管理的優(yōu)勢和作用。文書檔案數(shù)字化公司結(jié)合檔案管理的實際情況,探討文書檔案數(shù)字化歸檔管理的有效策略,旨在更好地服務(wù)文書檔案管理工作。
海洋檔案是各種海洋信息資源的集合。海洋檔案數(shù)字資源主要來源于館藏紙質(zhì)檔案數(shù)字化、電子檔案移交和歸檔、電子聲像檔案素材和網(wǎng)絡(luò)資源采集等,它在信息時代背景下呈現(xiàn)出規(guī)??焖僭鲩L、類型日益豐富的發(fā)展趨勢。
《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》中指出,要積極面對檔案信息資源多樣化的趨勢,加快數(shù)字信息資源轉(zhuǎn)型,并對海洋檔案數(shù)字化建設(shè)提出了新的要求。海洋檔案數(shù)字資源雖然突破了空間、時間的限制,便于共享和檢索,但是存在易被篡改的問題,這就需要提高管理技術(shù)水平。因此,數(shù)字化管理面臨著一系列的挑戰(zhàn)。
海洋文書檔案數(shù)字化歸檔管理的必要性
海洋檔案數(shù)字資源建設(shè)是文書檔案數(shù)字化歸檔的核心和基礎(chǔ),同時也為檔案數(shù)字化建設(shè)提供資源保障。數(shù)字資源指的是利用現(xiàn)代信息技術(shù),對海洋檔案信息資源進(jìn)行采集、加工、存儲和管理的信息資源總和,其通過網(wǎng)絡(luò)平臺提供檔案信息服務(wù)。數(shù)字化歸檔管理離不開專業(yè)的檔案數(shù)字資源,數(shù)字資源建設(shè)是檔案數(shù)字化建設(shè)的基礎(chǔ)工程。
第一,有利于推進(jìn)海洋信息化工作。數(shù)字資源是數(shù)字中國的前提和基礎(chǔ),是我國未來政務(wù)信息化建設(shè)的核心。只有加強(qiáng)海洋檔案數(shù)字資源建設(shè),實現(xiàn)數(shù)字化歸檔管理,才能提升海洋檔案信息開發(fā)和利用水平,推動海洋檔案乃至海洋領(lǐng)域、自然資源領(lǐng)域的全面信息化。
第二,有利于提升海洋檔案開發(fā)利用效能。數(shù)字化歸檔管理顛覆了傳統(tǒng)紙質(zhì)檔案的工作模式,將原本堆積在檔案室的資源推送給用戶,為用戶帶來高效、便捷的利用體驗。同時,借助信息挖掘、多媒體編輯等技術(shù)手段,可以更加充分地開發(fā)檔案資源的價值,彰顯檔案在海洋文化建設(shè)和宣傳工作中的作用,并借助統(tǒng)一的技術(shù)標(biāo)準(zhǔn)和平臺,實現(xiàn)海洋檔案數(shù)字資源的集中統(tǒng)一管理,推動海洋檔案信息資源的增值和共享。
第三,有利于推動海洋檔案管理理論與實踐的創(chuàng)新發(fā)展。海洋檔案數(shù)字化歸檔,為檔案管理工作帶來了新的機(jī)遇和挑戰(zhàn)。加快信息技術(shù)在檔案管理工作中的應(yīng)用,不僅使海洋檔案工作更加充分、全面地融入信息化進(jìn)程,同時也在管理理念、模式和方法上帶來了深刻變化。
數(shù)字化歸檔管理面臨的困難
海洋文書檔案數(shù)字化歸檔管理是一項復(fù)雜的系統(tǒng)工程,涉及一系列理論和技術(shù)問題,處理不好不僅會影響到數(shù)字化管理的進(jìn)程和效果,還會影響檔案數(shù)字資源的共享和利用,甚至導(dǎo)致檔案資源的閑置或損壞。
第一,文書檔案形式多樣化,尚無統(tǒng)一的數(shù)字化歸檔規(guī)范和標(biāo)準(zhǔn)。由于海洋檔案數(shù)量、類型眾多,整理流程復(fù)雜,目前尚未形成統(tǒng)一的標(biāo)準(zhǔn)規(guī)范體系,很難對文書檔案科學(xué)分類。所以,文書檔案形式的多樣化制約了數(shù)字化歸檔管理的實施。
第二,文書檔案數(shù)字化歸檔能力有待加強(qiáng)。海洋檔案數(shù)字資源中既有館藏紙質(zhì)檔案經(jīng)過數(shù)字化轉(zhuǎn)化而來的數(shù)字化信息,也有信息系統(tǒng)自動生成的各種電子文件,以及海洋監(jiān)測儀器生成的電子數(shù)據(jù)信息等。然而當(dāng)前海洋檔案電子資源中非紙質(zhì)檔案轉(zhuǎn)化的資源占比不高,數(shù)字資源自動歸檔能力較弱。同時,現(xiàn)有檔案管理人員和管理系統(tǒng)對于數(shù)字資源的歸檔管理和開發(fā)利用能力有限,未能為數(shù)字資源的采集、整理、存儲和開發(fā)利用提供足夠的支持,數(shù)字化程度并不高。
第三,文書檔案信息安全工作復(fù)雜。海洋檔案中存在很多涉及國家權(quán)益的寶貴信息,對于信息安全的要求很高。而在數(shù)字化建設(shè)過程中,海洋檔案數(shù)字資源的生成、傳遞、整理、歸檔、保管、利用都會涉及信息安全問題,尤其是數(shù)字資源易復(fù)制、易修改,信息載體不穩(wěn)定,導(dǎo)致信息安全面臨嚴(yán)峻挑戰(zhàn)。
數(shù)字化歸檔管理的有效策略
文書檔案數(shù)字化歸檔是利用數(shù)字化管理軟件,按照統(tǒng)一格式對文書檔案進(jìn)行著錄、建立目錄數(shù)據(jù)庫,而后運用掃描法將文件掃描為數(shù)字圖像,形成全文數(shù)據(jù)庫,以自動生成目錄和統(tǒng)計信息。文書檔案數(shù)字化歸檔管理工作的開展,需要在檔案數(shù)字化建設(shè)的背景下不斷摸索和嘗試,以豐富和完善數(shù)字化歸檔管理模式和方法,推進(jìn)海洋檔案數(shù)字化建設(shè)進(jìn)程的健康、有序發(fā)展。
統(tǒng)一數(shù)字化建設(shè)的標(biāo)準(zhǔn)規(guī)范
標(biāo)準(zhǔn)化體系包括文書檔案數(shù)字化歸檔范圍、數(shù)字資源加工規(guī)范、存儲標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)、安全標(biāo)準(zhǔn)等內(nèi)容。標(biāo)準(zhǔn)化體系建設(shè)是檔案歸檔管理的前提條件,將標(biāo)準(zhǔn)化建設(shè)納入海洋檔案數(shù)字化建設(shè)中長期規(guī)劃,這需要參照國際和國家標(biāo)準(zhǔn),并結(jié)合海洋檔案的特點與數(shù)字化建設(shè)目標(biāo),以統(tǒng)一海洋文書檔案加工、存儲、交換、管理、安全等方面的標(biāo)準(zhǔn)。
同時,要建立涵蓋海洋文書檔案歸檔制度在內(nèi)的全生命周期管理制度體系,就必須明確歸檔范圍和保管期限,以及數(shù)字資源收集、整理、保管、利用等方面的流程方法和管理要求。在建立健全文書檔案標(biāo)準(zhǔn)化體系和管理制度的基礎(chǔ)上,還要構(gòu)建標(biāo)準(zhǔn)化體系和管理制度的實施機(jī)制,有序推進(jìn)配套規(guī)章制度和標(biāo)準(zhǔn)規(guī)范的完善與落實,以實現(xiàn)海洋檔案數(shù)字資源的集成共建,為文書檔案數(shù)字化歸檔管理工作奠定堅實的基礎(chǔ)。
加強(qiáng)文書檔案歸檔管理能力
海洋文書檔案數(shù)字化歸檔工作對歸檔管理能力提出了很高的要求,不僅需要擁有強(qiáng)大的技術(shù)實力,還需要擁有專業(yè)的人員隊伍。這有助于改變檔案歸檔工作的被動性,真正將海洋檔案數(shù)字資源轉(zhuǎn)化為高質(zhì)量的知識服務(wù)。
第一,要著力培養(yǎng)一批具有海洋專業(yè)背景、熟悉檔案數(shù)字化的專業(yè)館員,以增強(qiáng)館員隊伍的技術(shù)水平和服務(wù)能力。為了適應(yīng)文書檔案數(shù)字化歸檔管理的要求,需要大力培養(yǎng)檔案管理人員的數(shù)字化素質(zhì),館員不僅要熟悉專業(yè)知識,還要掌握檔案管理軟件、數(shù)據(jù)庫等方面的知識,以及熟悉文書檔案數(shù)字化歸檔和數(shù)據(jù)庫維護(hù)工作。
單位加強(qiáng)館員隊伍的培訓(xùn)教育,定期組織館員參與培訓(xùn)活動,有利于館員了解文書檔案的歸檔方式、統(tǒng)計方法等知識,熟練掌握現(xiàn)代信息技術(shù)的運用技能,熟悉歸檔范圍、操作流程等工作內(nèi)容,以及更好地運用數(shù)字化技術(shù)優(yōu)化歸檔流程。
第二,要大力建設(shè)高水平的海洋檔案數(shù)字化管理系統(tǒng)。數(shù)字化歸檔管理需要在管理系統(tǒng)的支持下進(jìn)行,管理系統(tǒng)技術(shù)框架包括基礎(chǔ)環(huán)境層、資源層、應(yīng)用服務(wù)層和保障層?;A(chǔ)環(huán)境層是支撐數(shù)字化歸檔的系統(tǒng)軟硬件和網(wǎng)絡(luò)環(huán)境,其根據(jù)服務(wù)對象和資源密級不同而配置不同的基礎(chǔ)環(huán)境,實現(xiàn)按需配置,以提高服務(wù)效能和安全水平;
資源層涵蓋普通文件、數(shù)據(jù)和音像類的數(shù)字資源,從資源生成、目錄建庫到報表輸出實現(xiàn)規(guī)范統(tǒng)一;應(yīng)用服務(wù)層涵蓋資源采集、歸檔管理到開發(fā)利用等全過程的業(yè)務(wù)功能,面向用戶提供便捷的知識信息服務(wù);保障層是支撐管理系統(tǒng)運行的標(biāo)準(zhǔn)規(guī)范,包括數(shù)字資源分類、著錄規(guī)范和存儲規(guī)則、備份機(jī)制、安全機(jī)制等。
提升文書檔案信息安全水平
在海洋文書檔案歸檔管理工作中,要加大對安全管理方面的投入,做好數(shù)字資源的存儲和備份工作。根據(jù)海洋文書檔案的不同分類,應(yīng)采用合理的在線存儲和離線存儲策略,并借助先進(jìn)的網(wǎng)絡(luò)安全技術(shù)對數(shù)字資源進(jìn)行監(jiān)測保護(hù)。
海洋文書檔案涉及到國家機(jī)密信息,必須嚴(yán)格劃定密級和時間范圍,分類分批做好密級鑒定,對涉及機(jī)密的數(shù)字資源進(jìn)行利用限制。在軟件設(shè)置方面,需要考慮不同的密級要求,為不同級別用戶設(shè)置相應(yīng)權(quán)限,并采取安裝殺毒軟件、設(shè)置密碼輸入次數(shù)限制等安全防護(hù)措施。在硬件建設(shè)方面,應(yīng)在內(nèi)外網(wǎng)間設(shè)置防火墻,數(shù)字資源歸檔應(yīng)在內(nèi)網(wǎng)進(jìn)行。
綜上所述,隨著信息技術(shù)的發(fā)展與運用,海洋檔案管理的要求也在不斷提高。深入推進(jìn)文書檔案數(shù)字化建設(shè)工作,使文書檔案數(shù)字化歸檔工作朝著全面數(shù)字化、智能化的方向發(fā)展。這不僅要求檔案管理部門充分認(rèn)識到檔案管理數(shù)字化建設(shè)的重要性和必要性,積極投入資金和人力物力,建構(gòu)完善的數(shù)字化管理平臺,提高軟硬件建設(shè)水平;
還要統(tǒng)一文書檔案數(shù)字化歸檔管理的標(biāo)準(zhǔn)規(guī)范,建立健全檔案管理制度體系,優(yōu)化檔案管理環(huán)境;同時也要打造高水平的專業(yè)人員隊伍,提高檔案管理人員的數(shù)字化素質(zhì)和綜合素養(yǎng)。此外,還要加強(qiáng)文書檔案信息安全管理,做好安全防護(hù)和保密工作,避免檔案資源被損壞或盜用。通過以上措施,全面保障文書檔案數(shù)字化歸檔工作的質(zhì)量,為檔案數(shù)字化建設(shè)的有序推進(jìn)奠定良好的條件。
文書檔案數(shù)字化公司
文書檔案數(shù)字化形成的電子文件數(shù)量巨大,一般縣級檔案館文書檔案達(dá)幾百萬頁,將其數(shù)字化,所需存儲空間很大。選擇好檔案數(shù)字化副本存儲格式,既可減少存儲空間,也可提高上傳、下載速度,具有重要意義。
常見的文書檔案數(shù)字化圖像格式
1.1 JPG(JPEG)格式
這是我們接觸最多的圖像格式。手機(jī)拍攝下來的照片格式一般為JPG格式。JPEG是Joint PhotographicExperts Group的縮寫,直譯是“聯(lián)合圖像專家小組”。也就是說,該格式是由這個軟件開發(fā)小組制定的。這種圖像格式,就是把圖像壓縮,使圖像變得很小,所占存儲空間也就很小。在網(wǎng)絡(luò)上易于傳輸,一般網(wǎng)頁上的圖片都是這種格式。這種壓縮是損壞性壓縮,把圖像中重復(fù)或不重要的信息去除,容易造成圖像數(shù)據(jù)的損傷。JPEG格式優(yōu)點也多,可用最少的磁盤空間得到較好的圖像品質(zhì)。
1.2 JPEG2000格式
JPEG2000是JPEG的升級版,其特點:一是更高的壓縮率,一般比JPEG高出30%左右;二是支持無損壓縮;三是能實現(xiàn)漸進(jìn)傳輸。在網(wǎng)上看一些圖片,如網(wǎng)速較慢,往往先看到圖像的輪廓,然后出現(xiàn)模糊圖像,接著圖像會越來越清晰,這就是圖像漸進(jìn)式下載過程。JPEG2000重要特性是支持漸進(jìn)傳輸。
1.3 BMP格式
BMP圖像是微軟推出的圖像格式,在Windows操作系統(tǒng)中是作為標(biāo)準(zhǔn)圖像格式的,Windows應(yīng)用程序一般都會支持BMP格式。BMP是英文Bitmap的簡寫,應(yīng)用較廣泛。與JPEG比,它幾乎不進(jìn)行壓縮。由于幾乎不進(jìn)行壓縮,所以圖像信息非常豐富。它優(yōu)點突出,缺點也突出。缺點即是太占地方。
1.4 RAW格式
數(shù)碼相機(jī)進(jìn)行圖像格式切換,常見的是JPEG格式同RAW格式的相互切換。JPEG格式是一種壓縮格式,而RAW格式則是幾乎未經(jīng)處理而直接從數(shù)碼相機(jī)或數(shù)碼攝像機(jī)生成的圖像。如果同一數(shù)碼相機(jī),采用兩種格式拍攝,再經(jīng)過圖像處理軟件進(jìn)行調(diào)整,比如調(diào)曝光度、飽和度、對比度等,則RAW格式會更生動、更接近實際;JPEG格式由于進(jìn)行了有損壓縮,后續(xù)很難進(jìn)行校正,幾乎無調(diào)整余地。
1.5 GIF格式
GIF格式是英文Graphics Interchange Format的縮寫,即為可交換圖形格式,是作為一種公用標(biāo)準(zhǔn)而設(shè)計的。主要用來解決跨平臺圖像格式問題。GIF可制作成透明圖像、動畫等,在網(wǎng)絡(luò)上大量使用。
1.6 PNG格式
PNG格式可以說是完全為網(wǎng)絡(luò)而生的圖像格式,是替代無損壓縮的位圖格式,如GIF格式。PNG具有可編輯性,能制作成透明圖片,是最近幾年才被大多數(shù)瀏覽器支持的圖像格式。盡管它的壓縮率較高,但與JPEG比還是太大。
1.7 TIFF格式
TIFF是英文Tag Image File Format的縮寫,意思是標(biāo)簽圖像文件格式。TIFF、JPEG和PNG都是較為流行的高位彩色圖像格式,主要用來存儲包括照片和藝術(shù)圖片在內(nèi)的圖像。可以是多頁文件,即多個圖像組成一個TIFF文件。TIFF圖像文件格式有漏洞,可受到遠(yuǎn)程攻擊或是被誘使打開惡意文檔。
1.8 PDF格式
PDF是近幾年流行起來的圖像文件格式,是英文Portable Document Format的縮寫,意為便攜式文檔格式。如職稱申報系統(tǒng),幾乎所有圖像都需生成相應(yīng)的PDF文件。這種格式可以最少的文件數(shù)量上傳,也便于閱讀。
常用格式圖像大小比較
我們對文書檔案數(shù)字化,可采用掃描方法獲取圖像,也可采用拍攝方法獲取圖像。下面我們分別采用這兩種方法獲取圖像,然后將其按不同的圖像格式保存,比較一下圖像大小。
實驗一:用攝像頭拍攝一張色彩單一封面,分別采用JPEG、PNG、BMP、TIFF格式存儲,大小如下表。
通過上述知道,BMP是沒有任何壓縮的圖像格式,可理解為拍攝的圖像大小為901KB,其余幾種格式都有不同程度的壓縮,壓縮率最高的是JPEG格式。也就是說,一個901KB的圖像,生成JPEG才20KB大小。次之為PNG格式為418KB。由小至大排序為JPEG、PNG、TIFF、BMP。實驗二:換一張色彩豐富的封面進(jìn)行拍攝,分別采用JPEG、PNG、BMP、TIFF格式存儲,大小如下表。比較這兩張表,會發(fā)現(xiàn)隨著色彩的豐富,除了BMP格式外,其它格式圖像都變大了,由小至大排序為JPEG、PNG、TIFF、BMP。
通過兩次試驗,可得結(jié)論:(1)在上述幾種圖像格式中,JPEG是最小的圖像格式,BMP是最大的圖像格式。TIFF是較BMP格式第二大的圖像格式。(2)當(dāng)相同的像素大?。▋纱尉鶎?40像素,高480像素)時,色彩變化對BMP格式影響不大。其余格式都隨著色彩變化而有相應(yīng)變化,越豐富越大。
實驗三:把拍攝換成掃描,生成灰度文檔,分別采用JPEG、PNG、BMP、TIFF格式存儲,大小如下表。
結(jié)論:BMP是沒有任何壓縮的圖像格式,可理解為掃描生成的灰度圖像大小為917KB,壓縮率最高的是JPEG格式,它只占掃描生成圖像的23%。由小至大排序為JPEG、PNG、TIFF、BMP。
實驗四:以彩色模式掃描同一文檔,分辨率相同,分別采用JPEG、PNG、BMP、TIFF格式存儲,其大小如下表。
結(jié)論:BMP是沒有任何壓縮的圖像格式,可理解為掃描生成的彩色圖像大小為2742KB,彩色模式下,壓縮率最高的還是JPEG格式,它只占掃描生成彩色圖像的8.8%。而TIFF增長較大,PNG次之,這說明TIFF、PNG格式文件保存了較豐富的圖像信息。由小至大排序與灰度試驗一樣,依次是JPEG、PNG、TIFF、BMP。
實驗五:掃描多頁文件,生成TIFF和PDF文檔,比較文檔大小。掃描4頁文件,彩色模式,如下表。
生成4頁JPEG文件所占空間大小
結(jié)論:(1)生成的a.PDF文件大小為575KB,基本等于4頁JPG格式的文件大小之和(156+158+128+131≈575)。
?。?)生成的b.TIFF文件所占空間為a.PDF所占空間的7倍。這個倍數(shù)并不是固定的,但TIFF文件要比PDF文件大得多,至少2倍以上。
文書檔案數(shù)字化圖像格式選擇
《紙質(zhì)檔案數(shù)字化規(guī)范》(以下簡稱規(guī)范)規(guī)定:紙質(zhì)檔案數(shù)字圖像長期保存格式為TIFF、JPEG或JPEG2000等通用格式,圖像壓縮率的選擇可根據(jù)實際應(yīng)用需求而定。紙質(zhì)檔案數(shù)字圖像利用時,也可從網(wǎng)絡(luò)瀏覽速度、易操作性、存儲空間占用等方面進(jìn)行綜合考慮,將圖像轉(zhuǎn)換為PDF等其他格式。不難看出,紙質(zhì)檔案數(shù)字圖像保存格式為TIFF、JPEG或JPEG2000格式。
我們具體應(yīng)依據(jù)什么確定文書檔案數(shù)字化圖像格式?!兑?guī)范》要求“數(shù)字圖像清晰、完整、不失真,圖像效果最接近檔案原貌。為最大限度保留檔案原件信息,便于多種方式的利用,宜全部采用彩色模式進(jìn)行掃描”。
即掃描出的圖像盡可能接近實體。掃描出的圖像我們可以無限接近實體,但這些圖像必須保存下來,才能生成數(shù)字圖像。JPEG格式,是損壞性壓縮文件,壓縮率越高,損壞越大,只是我們?nèi)庋垭y以分辨,當(dāng)你想再次修正這種圖像時,可修正的余地很少,在更多細(xì)節(jié)上無法修正。但它的好處是存儲空間小,傳輸速度快。文書檔案數(shù)字化后,能滿足文字識別需要就可以了,所以,在300dpi下彩色掃描的數(shù)字檔案,采用JPEG格式保存較好。
TIFF格式與JPEG格式相比,優(yōu)點是可將多頁圖像生成一份文檔,能保存豐富的圖像信息。但它所占存儲空間是JPEG文件數(shù)倍,所以我認(rèn)為重要的文書檔案,可采用這種格式,一般文件不宜采用。應(yīng)注意,PDF格式不是數(shù)字化圖像長期保存格式。但從數(shù)字文件管理、調(diào)用等方面看,卻非常便捷,應(yīng)將PDF納入長期保存檔案基本格式,而非僅僅作為應(yīng)用層次的轉(zhuǎn)化格式。