2012年2月,美國《紐約時報》的一篇專欄文章稱,“大數(shù)據(jù)”時代已經(jīng)來臨。大數(shù)據(jù)技術(shù)能夠通過海量、動態(tài)數(shù)據(jù)的有效集成,推動社會治理的精細化和科學(xué)化進程,并有效節(jié)約社會治理的成本,大數(shù)據(jù)技術(shù)已經(jīng)吸引了世界多個的國際組織以及國家的關(guān)注,而當(dāng)前我國檔案部門不斷推進“檔案數(shù)字化建設(shè)”和“數(shù)字檔案館建設(shè)”正是檔案工作邁向大數(shù)據(jù)時代的基石。
目前,許多發(fā)達國家都已出臺相關(guān)政策大力扶持信息資源建設(shè),有的甚至將“大數(shù)據(jù)”設(shè)定為國家戰(zhàn)略,對其進行重點布局。如:美國政府已出臺大數(shù)據(jù)研發(fā)計劃,法國政府投入1150萬歐元研發(fā)7大數(shù)據(jù)市場項目,韓國建設(shè)開放型大數(shù)據(jù)中心等等,都在搶占新一輪技術(shù)革命制高點。2014年9月18日,聯(lián)合國開發(fā)計劃署與百度公司宣布達成戰(zhàn)略合作,共建大數(shù)據(jù)聯(lián)合實驗室。我國也正在加大信息資源管理人才的培養(yǎng)力度,加大對電子信息管理工作的人、財、裝備等方面的投入力度,以適應(yīng)時代發(fā)展需要。
全國各級各類檔案部門無論是現(xiàn)存的檔案資料,還是正在陸續(xù)接收的紙質(zhì)文件和日漸增多的電子文件、檔案數(shù)字化成果等,都是國家各行各業(yè)極其重要的信息資源,其綜合價值不可估量。
因此,將檔案數(shù)據(jù)與大數(shù)據(jù)的關(guān)系分析如下:
《檔案法》規(guī)定:檔案是指過去和現(xiàn)在的國家機構(gòu)、社會組織以及個人從事政治、軍事、經(jīng)濟、科學(xué)、技術(shù)、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。從檔案的定義來看,不同載體形式的檔案記錄的信息都可稱之為數(shù)據(jù)。從檔案的特征來分析,檔案具有社會性、歷史性、確定性及原始記錄性。而大數(shù)據(jù)也具有類似的特征,大數(shù)據(jù)也是人類社會活動的原始記錄,其內(nèi)容也具有確定性,且其記錄的內(nèi)容只反映事物已經(jīng)完成的狀態(tài),但不一定是原始記錄,有可能是二次以上的文獻。因此,檔案與大數(shù)據(jù)具有相似的特征,大數(shù)據(jù)是具有鮮明檔案特性的數(shù)據(jù)集合。但是,從數(shù)據(jù)的保存價值來講,有些數(shù)據(jù)集合對國家和社會沒有永久的保存價值,不需要永久保存。檔案記錄的信息經(jīng)通過數(shù)字化技術(shù)轉(zhuǎn)化為數(shù)據(jù),而辦結(jié)的電子公文形成電子檔案本身就是數(shù)據(jù)。
大數(shù)據(jù)時代檔案工作會出現(xiàn)新的變化,主要表現(xiàn)在以下兩個方面:
1.作為大數(shù)據(jù)技術(shù)的一部分,檔案數(shù)字化以及數(shù)字檔案館建設(shè)將得到極大促進
大數(shù)據(jù)并非是一個確切的概念,單從字面上來講,表示數(shù)據(jù)量的龐大,維基百科對大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授維克托·邁克-舍恩伯格認為,大數(shù)據(jù)是人們獲得新的知識、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構(gòu),以及政府與公民關(guān)系的方法。還有的學(xué)者用大數(shù)據(jù)的特征來闡釋定義,比較有代表性的是3V觀點,即大數(shù)據(jù)是具有規(guī)模性(volume)、多樣性(variety)以及高速性(velocity)的數(shù)據(jù)。因此,大數(shù)據(jù)的概念應(yīng)定義為記錄人類社會活動的、具有規(guī)模效應(yīng)的信息數(shù)據(jù)的集合,在大數(shù)據(jù)技術(shù)中必然包含了各種同構(gòu)、異構(gòu)的數(shù)據(jù)。檔案信息作為一種傳統(tǒng)且重要的數(shù)據(jù)信息在大數(shù)據(jù)中的重要地位是無可取代的,所以,大數(shù)據(jù)時代,檔案數(shù)字化和數(shù)字檔案館工作將得到極大加強。
2.大數(shù)據(jù)環(huán)境下,檔案部門的業(yè)務(wù)將不再僅僅局限于檔案,而會擴展至整個信息范疇,以檔案館為核心的國家、地方、行業(yè)大數(shù)據(jù)中心將出現(xiàn):
對于利用者而言,關(guān)心的是獲取數(shù)據(jù)信息的便捷性與數(shù)據(jù)有用性,對于是否是原始記錄、是或否被永久保存一般情況下并不關(guān)心。大數(shù)據(jù)時代使利用者能夠一次性獲取更全面的數(shù)據(jù),無需輾轉(zhuǎn)于各個不同的數(shù)據(jù)系統(tǒng)反復(fù)查詢,這也正是數(shù)據(jù)共享與大數(shù)據(jù)的意義所在。傳統(tǒng)的檔案館乃至數(shù)字檔案館只能為利用者提供檔案數(shù)據(jù),這與大數(shù)據(jù)的精神是不符的,而國家、地方、行業(yè)在建設(shè)大數(shù)據(jù)中心時依托的是那些數(shù)據(jù)保存量大、具有數(shù)據(jù)建設(shè)經(jīng)驗、對信息工作熟悉的部門,符合這些條件的主要是各級各類檔案管理部門(高校是圖書館),檔案部門依托現(xiàn)有技術(shù)與計算機網(wǎng)絡(luò)資源,通過拓展網(wǎng)絡(luò)、拓展相關(guān)數(shù)據(jù)的方式建設(shè)大數(shù)據(jù)中心,屆時檔案館服務(wù)的范圍將從傳統(tǒng)的檔案服務(wù)擴展到以檔案數(shù)據(jù)為核心、同時囊括行業(yè)相關(guān)的各種同構(gòu)、異構(gòu)數(shù)據(jù)的“大數(shù)據(jù)”中心,呈現(xiàn)在利用者面前的數(shù)據(jù)將由“檔案”逐步變化為“信息”與“大數(shù)據(jù)”。
因此,根據(jù)以上分析,此處有幾點建議:
1.檔案人員應(yīng)主動轉(zhuǎn)變觀念,適應(yīng)大數(shù)據(jù)時代檔案工作的要求;
2.加大數(shù)字檔案館建設(shè)的力度,為迎接大數(shù)據(jù)時代檔案工作新形勢打好基礎(chǔ);
3.檔案部門應(yīng)注意培養(yǎng)適應(yīng)大數(shù)據(jù)時代檔案工作的檔案干部;
4.加大資源整合與資源共享的力度,這也是大數(shù)據(jù)時代的要求。
轉(zhuǎn)載來源:黃河科技情報站
聯(lián)系客服