❶ 檔案學有哪些資料庫
【編者按】:檔案學就是探索檔案、檔案工作和檔案事業的發展規律,研究檔案信息資源的管理、開發的理論、原則與方法的學科。精品學習網檔案學欄目為您提供檔案學範文參考,以及檔案學寫作指導和格式排版要求,解決您在寫作中的難題。
淺談資料庫在檔案管理中的應用
[摘要]本文分析了資料庫在檔案管理中應用的現狀與不足,討論了利用資料庫技術對檔案進行管理的實現和應用,提出了有建設性的對策和建議,提出了自己的思考。
[關鍵詞]資料庫 檔案管理 應用
信息化是當今世界發展的大趨勢,是推動經濟社會發展和變革的重要力量。隨著我國各單位業務的急速發展,單純的手工記錄方式已無法及時有效地對檔案材料進行收集、整理、立卷、歸檔和管理。而計算機技術在近十年來的迅猛發展,使得各單位利用計算機對檔案進行輔助管理成為可能。檔案信息化是在檔案管理中全面應用現代信息技術,對檔案信息資源進行開發、管理和提供利用等服務,主要包括檔案資源數字化和網路化、檔案信息管理和利用提供的一體化、檔案信息的高度共享等。
《全國檔案信息化建設實施綱要》規定了我國近期檔案工作發展目標,《國家信息化發展戰略(2006年—2020年)》的審議通過,為檔案信息化提供了有力保障。計算機的介入打破了傳統的管理模式,使得原本鬆散、龐雜的檔案管理邁入了集中統一、信息自動化的新領域。雖然,利用計算機輔助管理檔案能大量減輕管理工作的強度、提高管理工作的效率,並能減少管理工作的失誤,但是由於計算機技術,尤其是資料庫的發展是一個逐步開發、完善的過程,同時使用該技術的工作人員也有逐步學習、應用的階段,因此計算機輔助管理各單位檔案中也存在著不少需要解決的問題。
一、資料庫在檔案管理中應用的現狀與不足
隨著各單位業務的不斷擴大,傳統的手工管理檔案的方法,已經不能適應成倍膨脹的檔案數量,也無法滿足社會對檔案的巨大利用需求,利用檔案管理軟體進行計算機管理是提高各單位檔案服務水平的必由之路。將手工管理的紙質檔案轉換為數字信息進入網路,即從檔案的實態轉換到虛擬態,檔案信息與載體分離,在這個意義上說網路傳遞的僅是檔案信息,用戶得到的僅是復製品,而非檔案原件。使用資料庫計算機輔助管理檔案不同於以往對紙質文檔進行收集、整理、立卷、歸檔、管理等工作,管理人員除了需要具備檔案管理業務素質外,還需要對計算機及資料庫應用具備一定的認識。有相當多的檔案管理工作人員知識結構老化,缺乏計算機技術知識,不能准確、規范地錄入基本信息,導致基本信息錯誤、缺失甚至張冠李戴。與此同時,由於一些檔案管理軟體在建立時僅考慮當時的數據量和用戶需求,資料庫結構中只有比較有限的幾個數據欄位,資料庫容量較小,不能導出通用格式的數據。當數據量成倍增加,資料庫運行的速度就相應減慢,使工作效率被迫降低。
二、資料庫在檔案管理中的應用建議
要全面提升檔案資料庫系統的安全水平是個艱難的過程,涉及方面很多,需要管理部門投入人量的人力物力。有些方面,例如,設備的可靠性,火災預防等方面,主要涉及投入力度的問題:防止人為的有意識破壞方面,如泄密監取密碼口令、計算機病毒、黑客等,主要依靠管理制度和計算機安全專項技術。但在資料庫的一致性、完整性問題上,檔案管理部門自身起著決定性作用。主要應關注以下幾點:
1.採用科學的資料庫開發方式
早期使用結構化方法開發的檔案管理軟體,其穩定性、可修改性和可重用性都比較差,用戶需求的變化往往造成系統結構的較大變化,並且需要花費很大代價才能實現這種變化。新的檔案管理軟體可採用面向對象的程序設計方法,商定一種或多種數據轉換方式,以便數據能夠在不同軟體之間實現信息共享。考慮到信息網路化的需要,檔案管理軟體可具備通過網頁進行數據查詢、交換的功能。同時還應考慮數據量增加的速度和資料庫技術發展的趨勢,以便今後對資料庫進行升級或更新換代。對於管理條例的各種文件可採用數碼照相或者文本方式進行保存整理,通過公文類程序或網頁進行交換及查詢。
2.確保檔案的保密性和安全性
單位檔案的保密性和安全性是十分令人關注的問題。檔案一旦進入計算機網路系統,網路的安全將直接關繫到檔案的保密性。對於計算機網路與電子文件所存在的技術上的弱點只能靠技術上的發展去解決。作為計算機網路的使用者,電子文件的形成者和保管者都有責任關注信息技術的最新發展,也有責任採用諸如防火牆、密碼技術、網關、虛擬保險箱、電子印章、電子水印等最先進信息技術解決上述問題。同時通過建立符合科研檔案技術發展規律的各種工作規范來保障電子文件的安全。只要工作規范,技術到位,這一科研檔案工作的主要障礙是完全可以解決與克服的。
加強網路監控,及時備份數據。網路中存在的安全性問題是對檔案管理系統安全性最大的威脅。目前有多種網路安全策略,各種安全策略必須相互配合才能真正起到保護作用,其中網路的訪問控制可以說是保證網路安全最重要的核心策略,它的主要任務是保證網路資源不被非法使用和訪問,它也是維護網路系統安全、保護網路資源的重要手段。另外,要注意建立計算機檢索查詢和提供檔案信息的主要服務方式,為使用者提供網狀信息組織結構,使用戶可以根據自己的意志沿著信息之間的關系鏈進行瀏覽,而不是按照規定途徑進行檢索和查詢檔案信息。
3.關注計算機病毒的新變化
當檔案信息系統擴展到區域網甚至互聯網時,計算機病毒成為不可迴避的危害,而且新型病毒具有許多網路時代的新特徵,例如,病毒傳播主要通過網路途徑擴散,病毒與計算機入侵關系密切,Windows操作系統的網路功能是常見的攻擊點,等等,檔案工作者應當時刻注意新的技術變化,制定針對性策略,並從管理制度、技術監督、後備保護、應急措施等多方面綜合防範。
4.加強法制建設
保障檔案信息安全單純依靠檔案管理部門自身的努力是不夠的,還需要有相關法律、規章制度的約束。因此,檔案信息安全與其它社會問題一樣,是一個復雜的綜合性較強的問題,各個環節必須緊密銜接才能發揮作用。立法在保障檔案信息安全性中的作用是不言而喻的,缺乏法律支持的信息安全保障是紙上談兵。我國已將信息安全列入國家信息化發展戰略,遼寧省早在1998年就通過了《遼寧省計算機信息系統安全管理條例)),這些都將在檔案信息安全保障中發揮重要作用,但隨著新問題的出現還需要更完善的、更專業的法律、法規出台。
參考文獻:
[1]張姝,韓振英.計算機在學籍檔案管理中的應用[J].洛陽工業高等專科學校學報,1998,(4).
[2]劉淑芬.計算機網路技術與學校檔案管理[J].學校檔案,1999,(1):23-25.
[3]徐志敏.計算機技術對檔案工作的影響[J].辦公室業務,2000,(3):32-33.
檔案資料庫建設中存在的問題及解決思路
錢毅
摘要:檔案資料庫是檔案信息資源管理的核心工具,目前我國檔案資料庫的建設和利用狀況還存在不少問題。作者首先解析了檔案資料庫的概念,指出應當從檔案業務需求的角度去考察資料庫的功能,並分析了檔案實踐的發展導致了檔案資料庫內容變化的幾大因素。在檔案建設過程中存在的問題包括缺乏有效統籌規劃、資料庫定位不準確、標准規范缺失、數據質量不高等。要解決這些問題,作者提出應當加強檔案資料庫規劃管理、完善標准規范、建立健全質量控制體系、培養人才隊伍等措施。
關鍵詞:檔案資料庫 概念 問題 思路
資料庫技術是20世紀60年代末發展起來的一門信息管理技術,是公認的信息資源開發、管理和服務的核心手段。目前資料庫的建設規模、信息量大小和使用頻率已經成為衡量一個國家信息化水平和綜合國力的重要尺度。在我國國家和地方各級的檔案信息化規劃中,檔案資料庫作為檔案信息資源管理的核心工具也都得到了廣泛的重視。但檔案界一直存在著如何盤活檔案資源、提高利用效率等問題。應該說,擁有先進的數據組織技術和靈活可靠管理手段的資料庫技術理論上可以從容面對這些挑戰,為檔案信息化搭建一個堅實的平台。事實上幾乎所有的檔案信息管理系統的中心都由檔案資料庫來擔當,無論其形式是檔案輔助管理系統還是所謂的數字檔案館。但檔案資料庫的建設和利用狀況仍然不容樂觀,還存在著數據結構封閉、數據質量不高,檔案信息資源尚未完全走出信息孤島的狀態。筆者擬從對檔案資料庫的概念、檔案資料庫的應用現狀及建設思路幾個方面來分析這些問題。
一、檔案資料庫概念解析
檔案資料庫的建設在我國已經有20餘年的歷史,但其理論發展卻並不充分。筆者通過期刊網(www.cnki.net)進行查閱,在1994~2005年間查詢到篇名中包含「檔案資料庫」的文章僅有28篇①,內容多局限在實際工作總結的層次上,對檔案資料庫的概念描述和理論挖掘相對較少。
通過文獻調研,筆者發現早在1987年孫淑揚就指出「檔案資料庫屬於文獻資料庫,是檔案自動化的重要內容,它是經過整理組織以機讀形式出現的檔案信息集合。②」洪漪編著的《檔案信息組織與檢索》中認為「機讀檔案資料庫,簡稱檔案資料庫,是以一定的組織方式存儲在一起的機讀檔案數據的集合。這些數據包括檔案題名、責任者、來源、頁碼、分類號、主題詞、摘要等,少數包含檔案全文。③」楊公之主編的《檔案信息化建設實務》一書認為「檔案資料庫,從廣義的角度講,就是以特定方式組織起來的檔案數據集合。具體地講,就是為了滿足多個用戶多種應用需要,按照一定的數據模型將本單位所保管的檔案信息存貯在計算機中以備使用的數據形式。④」
筆者無意為檔案資料庫給出一個確切的定義,因為作為支撐點的「檔案」與「資料庫」在實際應用中本身就是發散性很強的概念,而且還在不斷發展變化之中,上述定義都符合其各自特定的信息背景,以致檔案資料庫在不同階段的發展中出現了許多稱謂,如機讀目錄資料庫、索引資料庫,照片檔案資料庫、全文資料庫、多媒體檔案資料庫等等。因此研究檔案資料庫,需要綜合把握資料庫和檔案實踐的發展,獲得對檔案資料庫的相對完整的認識。
在研究資料庫時,除了掌握其先進的管理手段和操作方法外,更重要的是要立足檔案信息資源的特點,按照需求引導的原則關注資料庫中可以「為我所用」的部分,而不能片面追求資料庫功能而忽視基本的檔案需求。比如為了描述日益豐富的檔案數據類型,我們要求資料庫具有完備的數據類型能夠表達音頻、視頻、全文等信息類型;為了加強檔案數據質量控制,需要重點關注資料庫的完整性管理機制;為了保證檔案數據的安全,需要靈活應用資料庫的視圖功能、許可權管理以及加密機制等。此外,資料庫提供的共享交換、格式轉換、數據倉庫等核心功能可以為檔案資料庫提升管理水平和管理層次都提供技術保障。
同時,我們還要關注檔案實踐活動的變化,關注這些變化可能對檔案資料庫帶來的影響。筆者認為影響檔案資料庫內容的主要因素有如下三個方面。
1.檔案實體管理。在近年的檔案管理活動中出現了許多新情況,比如2000年出台的《歸檔文件整理規則》允許在文書檔案實體管理活動中取消「卷」的概念,這直接影響到檔案資料庫是否還需要「卷」這一級邏輯層次,從而影響相關表的數據結構。信息記錄技術的發展引進了許多新型載體,目前紙張、照片、膠片、縮微膠片、硬碟、軟盤、磁帶、各類光碟、圖紙等共存一室並不鮮見,不同類型的載體需要有不同的數據表來進行管理,檔案信息化規劃中還要求將這些載體的信息通過各種方式數字化後進入計算機系統,這也極大地豐富了檔案資料庫的內容。此外,在檔案信息利用環節,用戶全文和多媒體信息檢索需求也會促進檔案資料庫的數據類型的拓展。
2.檔案資料庫設計活動。在多數情況下,檔案資料庫系統並不只是純粹檔案數據的集合,還包括檔案管理活動中的其他信息,這些信息可以在資料庫設計過程中被納入管理。比如,在使用數據流圖等工具進行資料庫需求分析的時候,可以將許多業務流程方面的管理信息納入數據字典;資料庫的概念設計階段經常使用的ER模型(Entity-Relation Model)要求仔細分析檔案管理域中各實體及其之間的聯系,並據此建立檔案資料庫模式,通過這種設計方法得到的資料庫通常還包括一些管理實體,比如包括各類人員庫、標准庫、組織機構表、保管期限表、人員許可權表、庫房信息等,甚至包括檔案借閱者信息,而其中相當一部分不屬於檔案本體數據所包含的范圍。
3.應用環境。不同的機構具有不同的應用環境,像檔案館與一般業務部門的應用環境就有很大差別,它們對於檔案數據具有不同的管理要求。比如在信息集中管理應用環境中,為了管理方便,往往將檔案與資料、期刊、報紙、圖書等大量的非檔案成分進行集中管理;文檔一體化環境則將文件與檔案數據共存一庫,彼此依存,或者乾脆就是合而為一;電子文件管理應用環境則根據前端控制原則,要求電子檔案資料庫的建設不能採用事後建庫的方式,而必須深入到文件形成階段,收集電子文件生命周期的完整信息。因此可以看出,不同應用環境下建立的檔案資料庫的內容範圍存在較大的差異。
通過簡要分析檔案資料庫概念的內涵及其變化,筆者認為對於檔案資料庫的理解不能一刀切,而應該立足檔案資料庫建設單位的實際環境和系統需求,將包括檔案實體信息、管理信息、應用環境信息在內的各種類型數據按照特定數據模型進行組織的數據集合,並以此為據來考察目前我國檔案資料庫存在的一些問題。
二、檔案資料庫建設中存在的問題
在檔案信息系統的建設過程中,軟硬體設施可以通過購買、引進而獲得,但一個行業或者部門的信息資源是買不來的,只能依靠自己建設。檔案資料庫作為檔案信息資源採集、處理、存儲和傳輸中心,在檔案信息資源中佔有舉足輕重的作用。因而從宏觀上講,如何規劃設計檔案資料庫的建設,是關系檔案信息化進程是否能夠順利進行的關鍵因素。應該說,我們在這方面取得了很大的進步,資料庫建設數量、分布的范圍、發展的勢頭都是可喜的,初步消除了檔案部門會淪為「信息孤島」的疑慮。但同時,許多檔案資料庫建設中的問題也浮上檯面,能否解決好這些問題是關系檔案資料庫未來發展的關鍵。
1.檔案資料庫建設缺乏有效的統籌規劃
檔案資料庫建設是檔案信息資源開發的核心工作,但目前我國檔案資料庫建設缺乏有效的統籌規劃。在國家檔案資料庫建設層面上,除了明清、民國、革命歷史檔案資料三個目錄中心的建設已經啟動外,尚未有國家級檔案資料庫的規劃安排,各地檔案部門在實際建立檔案資料庫時基本上是各自為政,在檔案數據標准體系尚不完善的情況下,這種局面將會導致數據共享困難。雖然我國就檔案資料庫的建設也提出過總體指導意見,比如《全國檔案信息化綱要》一文中多次提到檔案資料庫的建設問題,提出「加強檔案目錄資料庫建設」、「進一步加強檔案目錄中心建設」、「積極推進檔案全文資料庫和多媒體資料庫建設」等,但這些意見缺乏可操作性。此外,如何將電子文件以及數字化檔案的信息納入檔案資料庫中進行管理,也需要在宏觀層面上進行有效的統籌規劃。
2.把握好資料庫定位
也就是要回答好「建設什麼樣的檔案資料庫」的問題,回答這個問題需要充分了解檔案資料庫的內涵,明確建庫的需求和目的,確定資料庫定位,有的放矢。資料庫定位將直接影響到資料庫的建設成本、規模、效能等,是進行檔案資料庫以及信息系統建設的一個基本出發點。比如,是建立存儲檔案著錄信息為主的目錄資料庫,還是建立存儲檔案全文的全文資料庫;是根據館藏的特點建立具有特色的資料庫,還是基於館藏圖片、音像等資料建立綜合
性多媒體資料庫;是建立檔案信息管理系統、文檔一體化系統還是電子文檔管理系統;是獨立建庫還是若干機構建立聯合目錄中心,或者是為未來的數字檔案館做數據准備。這些問題都需要提前論證,做好決策。而我們目前的檔案資料庫建設,在定位方面做的工作還不充分,許多資料庫千篇一律,缺乏特色;或者資料庫結構相似卻不能聯合,各自為戰,造成資源分散,工作量重復。
3.資料庫設計盲目性大,存在不科學的成分
資料庫設計是一項非常嚴謹、科學性很強的一項工程,從可行性分析開始,逐次進行數據分析,繪制資料庫的數據字典,然後運用各種工具進行概念模型設計、外模式設計和物理設計,最後才能裝載資料庫。其中的各個步驟都必須認真對待,偏廢不得,前一階段的設計是下一階段工作的基礎,不適合跨越設計階段開展工作。
但在實際的檔案資料庫設計過程中,還存在著許多不科學的問題。特別在資料庫可行性分析和數據分析階段存在的隨意現象比較突出。許多設計者對繁瑣的數據分析不太重視,往往一上來就開始設計庫表結構,這種脫離詳細分析的設計方法雖然表面上速度較快,但其質量經不起推敲。對任何一個資料庫系統而言,庫表結構是其基石所在,基石不牢,大廈則有將傾之虞。
4.資料庫邏輯結構缺乏規范
在進行資料庫邏輯結構設計時,相關標准規范缺失是造成檔案資料庫的設計工作流於隨意的主要原因,而檔案資料庫邏輯結構不規范的情況會引起資料庫之間轉換困難、難以共享等問題。目前正在許多單位開展的數字化工作所形成的圖像文件、視音頻文件如何建庫管理,目前尚未有相關規范出台。電子文件管理元數據規范的滯後使得電子文件歸檔數據難以收集齊全,還有不少電子文件仍在進行人工著錄登記,長此以往,前端控制原則難以在應用系統中得到應用。而在欄位結構層面上,不規范的情況則更為突出。像在檔案資料庫中通常作為主鍵的「檔號」欄位的表示方法就五花八門,根據浙江省綜合檔案館信息資料庫建設調查報告的調查結果,在這浙江省通用的6種檔案軟體中,有的用4個欄位來表示檔號;有的定義成數字形式;有的定義為字元型,甚至同一個檔案館在不同時期錄入的數據,表示形式也不統一。這將對日後資料庫遷移、目錄中心數據合並等工作帶來極大的困難。
5.數據質量
檔案資料庫的建設必須保證良好的數據質量,「問水哪得清如許,為有源頭活水來」這句古詩啟示我們,准確的資料庫信息、良好的數據管理是營造檔案資料庫「一池清水」的先決條件。作為重要的社會信息資源單位,檔案部門必須高度重視檔案數據質量,在追求資料庫數量增長的同時,還要加強「污染防治」工作,防止臟數據的產生。而根據浙江資料庫現狀調查報告,隨機檢查結果表明檔案資料庫質量較好的數據誤差也在12%左右,總平均差錯率達29%,造成這種狀況的原因主要在錄入階段,同時資料庫的質量檢查制度不完善也是重要原因。
三、檔案資料庫發展中存在問題的解決思路
1.加強資料庫建設規劃管理
資料庫建設是一項投入非常巨大、周期很長、事關信息化成敗的基礎工程,應當由檔案事業管理部門提供宏觀的指導方針,統籌規劃,合理布局,提供本地區或本行業資料庫建設的藍圖,並會同有關部門對資料庫規劃的可行性進行論證,提出檔案數據建設的具體意見。地方檔案部門則根據宏觀規劃的要求進行詳細設計,以實現全局共享為基礎,突出特色數據。基於這樣的總體思路,可以建立大范圍內協調一致的數據結構,資料庫框架設計、數據內容都能得到很高的共享度,將會改善目前檔案資料庫建設自行一套、質量參差不齊的總體狀況。
2.加強標准規范的建設
檔案信息資源描述標准體系是建設檔案資料庫的重要保障,相關標准規范的確立和逐步完善有助於各級各類檔案資料庫需要保持必要的協調,共同為社會提供高效、優質的檔案信息服務。檔案標准規范的制定要本著「確保數字檔案資源格式統一、數據規范、長期可讀、便於共享」的原則進行。在實施過程中,應當積極採用國際標准和國外先進標准;一般性的信息處理標准優先採用國家標准,如《文獻保密等級代碼》、《全國行政區劃代碼》等標准應當直接採用國家標准,不必另行一套;對檔案領域內特有的資源制定行業標准,如《壽險業務檔案管理標准》。此外為了保證國家文獻系統標准之間的一致性,檔案工作標准應盡量與圖書、情報的國際、國內標准相一致。
3.建立標準的元資料庫
目前資料庫的邏輯結構設計比較混亂,雖然從各資料庫個體角度觀察,並沒有太大的差錯,但結構的不一致、不兼容會對資料庫的共享和相互轉換帶來很大的困難,甚至難以進行。筆者認為,這個問題的最終解決,依賴於以著錄標准化為依託的元資料庫的建設。
目前檔案資料庫的主要記錄對象是檔案文件的二次文獻信息,即文件的著錄信息。許多檔案資料庫結構的確定其實就是將著錄卡上的項目轉換為數據表上的欄位信息。從原理上講,這個過程應該很容易,但由於我國的《檔案著錄規則》,雖然規范了著錄項目,但並沒有規定相應的量化指標,離資料庫系統所要求的結構化數據的要求還有相當距離。由於著錄標准並不是確定數據結構的強制標准,各檔案資料庫在建設時都可以根據自己的理解靈活應用,著錄項目可以自行增刪,欄位類型、欄位長度可以自由選擇,這樣的資料庫進行互聯互通的難度就可想而知了。因此筆者建議以著錄標准為基礎,建立一定范圍內的元數據標准,此處的元數據就是關於資料庫中各數據欄位的信息,並以此為基礎構成元數據字典。該字典提供數據項目的結構化信息,包括數據欄位的名稱、數據類型、長度、默認格式等規范,並說明欄位之間的聯系。需要指出的是,這樣一個具有內在聯系的有機的元數據字典,實質上是為檔案資料庫提供通信格式,並不要求完全遵循,如果有特殊要求,只需要在此基礎上提供轉換功能即可。隨著檔案信息化的深入,元數據字典的建設還應當包括全文和電子文件的元數據項目,為電子文件管理系統的設計提供相應的元數據,實現電子文檔的前端控制,從而在根本上解決電子文檔介面規范問題。
4.建立健全資料庫質量控制體系
針對檔案資料庫數據質量的問題,筆者認為應當將檔案資料庫視作檔案部門的信息產品,並依照生產產品的管理方式,通過質量控制體系進行監管。該體系以可操作的方式提供對檔案資料庫的全面質量管理,包括資料庫設計、建設、管理活動中主要環節的控制,並制定資料庫質量考核指標體系。該體系要求將資料庫設計過程作為單獨的項目進行管理,通過項目文檔能夠審查資料庫設計過程是否科學、合理;能夠對資料庫建設過程中的人、財、物進行審計;對數據收集、錄入、備份等各環節提供質檢措施,保證數據准確、完整;通過質量指標體系對資料庫容量、響應時間、查全率、查准率、錯誤率等進行核查。依照質量控制體系進行管理,能夠優化資料庫管理活動,加強資料庫建設人員的責任感。
5.加強檔案資料庫隊伍建設
隨著檔案事業的不斷推進,對檔案信息管理人員的要求越來越高。檔案資料庫作為檔案信息化建設的中樞工程,其規劃、設計、實施、管理、維護、標准建設等都需要相關人員具有較高的綜合素質,不僅要熟悉館藏,了解基本檔案理論、業務流程、未來發展,還要掌握資料庫管理的基本技能,對於檔案資料庫管理員,還需要具備一定的規劃能力和標准化知識,而目前這方面的人才是比較缺乏的,需要檔案部門和教育機構通力合作,培養通曉檔案資料庫建設的全面人才,全面推進檔案信息資源的開發進程。
注釋:
①查詢時間:2005年9月16日,檢索形式為「篇名」,檢索模式為「精確檢索」,資料庫來源為「電子技術及信息科學輯目錄」,特此說明。
②孫淑揚編著:《檔案管理與計算機》,第176頁,檔案出版社1987年3月。
③洪漪編著《檔案信息組織與檢索》,第146頁,武漢大學出版社,1998年1月。
④楊公之主編:《檔案信息化建設實務》,中國檔案出版社,2003年,第103頁。
(原文載於《檔案學通訊》2006年第4期)
❷ 哪個資料庫不能提供期刊全文下載
維普、萬方資料庫里的文獻不能提供全文下載。維普中文期刊全文資料庫6.33收錄了1989的科技期刊近萬種,各類學術論文數千萬條,其中絕大多數有全文。
維普資訊是科學技術部西南信息中心下屬的一家大型的專業化數據公司,是中文期刊資料庫建設事業的奠基人,公司全稱重慶維普資訊有限公司。
已經成為中國最大的綜合文獻資料庫。從1989年開始,一直致力於對海量的報刊數據進行科學嚴謹的研究、分析,採集、加工等深層次開發和推廣應用。自1993年成立以來,公司的業務范圍已涉及資料庫出版發行、知識網路傳播、期刊分銷、電子期刊製作發行、網路廣告、文獻資料數字化工程以及基於電子信息資源的多種個性化服務。
萬方資料庫是由萬方數據公司開發的,涵蓋期刊、會議紀要、論文、學術成果、學術會議論文的大型網路資料庫;也是和中國知網齊名的中國專業的學術資料庫。
其開發公司——萬方數據股份有限公司是國內第一家以信息服務為核心的股份制高新技術企業,是在互聯網領域,集信息資源產品、信息增值服務和信息處理方案為一體的綜合信息服務商。
萬方商務信息資料庫
《中國企業、公司及產品資料庫》始建於1988年,由萬方數據聯合國內近百家信息機構共同開發。十幾年來,CECDB歷經不斷的更新和擴充,現已收錄96個行業的近20萬家企業詳盡信息,是國內外工商界了解中國市場的一條捷徑。
目前,CECDB的用戶已經遍及北美、西歐、東南亞等50多個國家與地區,主要客戶類型包括:公司企業、信息機構、駐華商社、大學圖書館等。國際著名的美國DIALOG聯機系統更將CECDB定為中國首選的經濟信息資料庫,而收進其系統向全球數百萬用戶提供聯機檢索服務。
❸ 下面哪個資料庫不能檢索到期刊論文
多數論文存在著兩條或兩條以上的線索。如《藤野先生》,文章除了以作者與藤野先生交往為敘事線索(明線)外,還有作者愛國主度思想感情這一暗線。
記敘的順序要求掌握的是順敘
❹ 資料庫有哪些類型
模糊資料庫
指能夠處理模糊數據的資料庫。一般的資料庫都是以二直邏輯和精確的數據工具為基礎的,不能表示許多模糊不清的
事情。隨著模糊數學理論體系的建立,人們可以用數量來描述模糊事件並能進行模糊運算。這樣就可以把不完全性、不確定性、模糊性引入資料庫系統中,從而形成模糊資料庫。模糊資料庫研究主要有兩方面,首先是如何在資料庫中存放模糊數據;其次是定義各種運算建立模糊數據上的函數。模糊數的表示主要有模糊區間數、模糊中心數、模糊集合數和隸屬函數等。
統計資料庫
管理統計數據的資料庫系統。這類資料庫包含有大量的數據記錄,但其目的是向用戶提供各種統計匯總信息,而不是提供單個記錄的信息。
網狀資料庫
處理以記錄類型為結點的網狀數據模型的資料庫。處理方法是將網狀結構分解成若干棵二級樹結構,稱為系。系類型
是二個或二個以上的記錄類型之間聯系的一種描述。在一個系類型中,有一個記錄類型處於主導地位,稱為系主記錄類
型,其它稱為成員記錄類型。系主和成員之間的聯系是一對多的聯系。網狀資料庫的代表是DBTG系統。1969年美國的
CODASYL組織提出了一份「DBTG報告」,以後,根據DBTG報告實現的系統一般稱 為DBTG系統。現有的網狀資料庫系統大都是採用DBTG方案的。DBTG系統是典型的三級結構體系:子模式、模式、存儲模式。相應的數據定義語言分別稱為子模式定義語言SSDDL,模式定義語言SDDL,設備介質控制語言DMCL。另外還有數據操縱語言DML。
演繹資料庫
是指具有演繹推理能力的資料庫。一般地,它用一個資料庫管理系統和一個規則管理系統來實現。將推理用的事實數據存放在資料庫中,稱為外延資料庫;用邏輯規則定義要導出的事實,稱為內涵資料庫。主要研究內容為,如何有效地計
算邏輯規則推理。具體為:遞歸查詢的優化、規則的一致性維護等。
❺ 大數據在供應鏈中的應用
大數據在供應鏈中的應用
大數據在供應鏈中的應用,大數據這個詞現在我們經常會聽到,而且我們只知道生活已經離不開大數據,卻不知道它具體在哪些方面發揮著作用,下面看看大數據在供應鏈中的應用。
1、有關大數據
1.1分析大數據
在這個信息公開的社會里,我們每天都可以從外界獲得大量的信息。但是隨之而來的疑問也出現了,在這樣龐大的數據中我們如何知道哪些信息是對我們有利的呢?在大數據時代里,如何快速精確的獲得有用信息成為了我們迫在眉睫的問題。
1.2大數據分析在供應鏈管理中的作用
數據的分類有著很重要的作用,大數據的種類也對他的表現形式有著至關重要的影響,比如說收集這個信息的方式和方法。在如今的公司供應鏈管理中,影響最大的就是EPR數據,它包含了企業在運行過程中的各方面的數據,這也是我們去了解一個企業的重要數據。
還有一些數據是有關社會數據和客戶數據,通過這些數據我們可以了解到一個新的項目所涉及的參與的人數,達到的效果,從而是企業達到更加高效合理的發展。
1.3大數據分析的特色
和傳統數據分析不同的是,大數據分析可以更加具體的去描述。因為時間在流逝而大數據分析記載下來的東西卻不會自動流逝或者更新,所以大數據分析具有流逝性,因為所有的信息都是人們記載得來的,只有人們的參與與分享才能獲得大數據,所以大數據分析和人們不可或分。因為大數據分析具有智慧性,所以它可以通過我們平時的搜索詞或者喜好自動為我們推送我們可能感興趣的資料。
2、大數據分析與供應鏈之間的關系
2.1供應鏈管理的作用
在有大數據分析的前提下,供應鏈才能找到合適的原料供應商。供應鏈就像一條食物鏈,都處在他們各自應該有的分支上。所製造的產物要在合適的渠道下一層層的在相應的分支下傳遞下去。供應鏈管理這個時候起到了作用,它的作用是通過合適的方法讓客戶的花費最小而得到的效益最高,從而實現共贏。
2.2二者的有效應用
供應鏈與大數據分析從頭到尾都有著密不可分的聯系。中國在社會主義市場經濟改革的道路上越走越遠,所以企業供應鏈管理工作也在提高。我們也更加重視企業供應鏈管理方面的有效利用,這就不可避免地與大數據分析聯系起來,大數據分析在企業供應鏈管理的每一步都有著不可缺少的作用。想要好的質量和效率,就一定要重視大數據的分析結果,將它與企業供應鏈管理工作巧妙結合。
大數據分析也可以給我們提供一個廣闊的視野,去觀察各個環節是怎樣利用我們所提取的信息,這樣會更加方便我們了解通過大數據分析所得到的效益。通過大數據分析對企業某項目走勢進行猜測、分析、整理。為了保證利潤的最大化,需要我們對大數據分析的結果進行研究,用最有用的信息來提高工作的效率和質量。
2.3大數據分析與供應鏈的決策關系
大數據分析的應用可以用在已經確定的項目上,分析的結果與決策聯系起來,決策有不足的地方可以通過大數據分析發現,進而彌補不足。供應鏈也具有風險性,所以大數據分析的結果能為供應鏈在目標項目上提供好的營銷決策、利用大數據分析,化無用為有用。大數據分析的好處大家都知道,所以有很多公司利用大數據分析來獲取供應鏈,但是這並不是所有的公司都能駕馭的了的,許多公司還不能滿足其要求。
2.4大數據分析與供應鏈
大數據分析在供應鏈管理中的應用模式。從物料來源來講,供應商進行風險評估,將產品以特色進行區分,物料來源渠道的選擇,供應商達到一體化水準,供應商進行談判。從加工生產來看,首先進行存貨優化,再進行產能維持,接著工廠選址,最後是人力資源。
從物流配送來看的話,則是配送與物流優化,再選擇好的運輸方案,然後例行路線的安排,接著是指定完美的運輸路線,最後配置運輸車輛。從銷售服務來看,首先基於地域的市場開發,其次分析店內的消費行為,接著對客戶群進行精細的劃分,然後進行多渠道的市場開發,最後優化開發方案。這些都是大數據分析在各個領域內的作用,所以我們要好好的利用大數據分析,從而獲得較大的收益。
3、問題與現狀
3.1大數據分析的現狀
日常生活中我們都會獲得大量的信息,而這些信息如果不加以歸納整理,一定是一堆沒有用的信息,我們不能精確的從裡面提取出來真正需要的東西。企業也是這樣,信息不經過分析,就只是沒用的數據。所以在企業里決策和分析有著至關重要的作用,只要認真發掘我們能從大數據中得到很多有用的消息,從而將商業信息變成商業智能。
3.2大數據分析的問題
從各類新型軟體的興起中我們不難發現,如今的大數據分析的應用的作用並沒有被完全利用,比如抖音的興起,抖音帶給我們許多歡樂,我們也可以從這個軟體上獲得許多消息,但是如果我們認真的想一想,抖音帶給我們的信息是不是太過於碎片化,只通過一個十幾秒的視頻我們不能了解一件事情的真相,而且還有可能被誤導。所以供應鏈管理遇到了這方面的困難,解決大數據分析片面化與碎片化至關重要。
3.3大數據與市場
大數據分析可以看出是以人民大眾作為目標的。在市場中漸漸的將大數據的分析結果作為核心開始轉型,去面對人民群眾的真正需求和解決這些需求。我們也可以利用大數據分析去尋找所需要的人,去分析他們所需要的東西,然後去供給。通過這些潛在的客戶來提升公司的效益。
為公司帶來效益的同時也為他們帶來好處,何樂而不為。大數據分析還能為市場找到某一物品的平均價格,可以按照地區細分,這樣一來,更加方便進行價格調整。
人們經常說,顧客就是上帝,所以滿足顧客的需求非常重要,好的供應鏈管理對流程和運營有著較高的要求,所以這也需要好的大數據分析為我們提供基礎。從大數據分析的預測也可以為企業提供好的基礎。
4、總結
我們生活在大數據年代裡,許多新興產業已經離不開大數據,他們依賴著大數據分析為他們帶來的好處,大數據分析對市場預測的准確度也為企業帶來了便利,幫助公司制定好的計劃企業的管理人員要了解供應鏈與大數據分析之間的關系,不斷改進大數據分析的模式。同時他們也在努力的去了解大數據分析,期待著能從大數據分析中再得到更多的效益。我們的生活也因為大數據分析有了天翻地覆的.改變。
一、大數據的定義
那什麼是大數據呢?麥肯錫將大數據定義為:無法在一定時間內用傳統資料庫軟體工具對其內容進行抓取、管理和處理的數據集合。顯然麥肯錫將大數據定義的重點放在了「大」上。誠然,人們最初接觸大數據的時候,震撼於大數據爆發性增長所帶來的的巨大體量,最強烈直觀的感受就是「大」。但隨著時間的推移,人們開始分析,挖掘數據,去探索數據背後隱藏的價值,自此數據金礦展露出礦山一角,開始在時代洪流中大放金光,大批淘金者蜂擁而上,更是助推了大數據的蓬勃發展,最終促成了大數據生態系統的形成。
筆者大膽的對時代背景下的「大數據"做出如下定義:以海量數據為基礎,以數據的整理、分析、挖掘為過程,並最終以實現數據價值為結果的一整套理論和實踐就是大數據。
筆者認為大數據的內在生命力是數據的持續性爆發增長,而外在特徵用數據人普遍認同的5V加以描述:
Volume:數據體量巨大。就是大。
Variety:數據類型繁多。繁雜紛復的屬性和行為數據以結構化或者非結構化的形式存儲在形式各異的存儲器上。
Value:價值密度低。數據萬千,可提取的價值往往只佔萬一。更因此,科學的數據挖掘和高精度演算法才顯得如此重要。
Velocity:處理速度塊。數據體量巨大,且增長迅猛,不快實在不行。
Veracity:真實性。真實的數據帶來真實的價值,弄虛作假切不可取。去偽存真也是一種真實,需要每個數據人的努力。
二、大數據的應用
大數據正在滲透到我們生活的方方面面,在生產、經營活動、流通、生物醫學、城市管理、安全防護、金融、營銷等各個領域大放異彩。
1.智能推薦系統作為大數據在互聯網領域的最廣泛普遍的應用,通過分析用戶的歷史行為習慣,來了解用戶的喜好,從而為用戶推薦感興趣的信息,滿足用戶的個性化推薦需求。從各大電商平台,到門戶網站,再到近年大火的短視頻平台,無不能發現它的蹤影,給人們真正帶來了千人千面的個性化優質體驗。
2.大數據在生物醫學領域的應用,通過統計分析大量網民搜索的流行病信息,結合氣溫變化,環境指數,人口流動等因素,創建一個個預測模型,預測未來疾病的活躍指數,提供疫病預防建議,來實現以防代治。
3.大數據在物流領域的應用,利用集成智能化技術,在大量數據訓練下,使得物流系統能模仿人的智能,具有思維、感知、學習、判斷的能力自行解決物流中的某些問題,包括但不限於存貨盤點、揀貨、包裝、單據管理、運輸、物流追蹤、派送時間預測等等問題,強力助力完善物流體系的智能化進程。
再比如利用大數據打造智慧城市,在安防方面,構建7*24小時不間斷的治安監控,在金融領域用於分析市場情緒,評估信貸風險等等。隨著大數據的應用越來越廣泛,我們在日常生活中,會越來越受益大數據帶來的價值。
大數據是什麼意思
大數據是指那些數據量特別大、數據類別特別復雜的數據集,這種數據集不能用傳統的資料庫進行轉存、管理和處理,是需要新處理模式才能具有更強大的決策力、洞察發現力和流程優化能力的海量、高增差率和多樣化的信息資產。
而大數據的主要特點就是數據量大、數據處理速度快、數據真實性高、數據類別復雜等,它們合起來被稱為4V。
大數據也可以應用在警察預測犯罪的發生、預測選舉結果,同時還能通過手機定位數據和交通數據建立城市規劃,現在醫療行業也在做大數據的分析。
現在社會發展速度非常快,科技也很發達,信息的流通和人們之間的交流也非常密切,而大數據就是這個時代高科技的產物。
對於大部分行業而言,怎麼運用這些大規模數據是贏得競爭的關鍵,但同時,大數據在經濟發展中的意義不能取代一切對於社