⑴ 基於大數據的圖書館個性化服務讀者行為分析方法和策略
1. 基於大數據的圖書館個性化服務讀者行為分析方法與步驟
基於大數據的圖書館個性化服務讀者行為分析,是指圖書館基於事件存儲大資料庫數據的支持,通過對用戶海量數據進行採集、過濾、分析和定義,從中發現讀者行為數據中蘊含的行為關系、用戶需求和知識,是對讀者的行為進行分析、判定、定義和匹配的過程,也是圖書館掌握讀者閱讀習慣和發現服務需求,提高個性化服務精確性和用戶滿意度的關鍵,讀者行為分析與判定流程見圖2-2。
讀者行為分析過程可分為用戶行為事件採集、用戶行為事件的存儲、用戶行為事件初步過濾、用戶行為定義、用戶行為分析與判定、用戶行為匹配、用戶行為存儲大資料庫的更新、行為分析與判定過程的完善8部分內容。在用戶行為事件分析、判定前,圖書館應全面、規范地採集讀者行為數據,並對數據進行科學分類、綜合分析、行為定義和人工匹配,構建具備海量存儲、高效管理和查詢功能的用戶行為事件存儲大資料庫。
當圖書館完成對用戶行為數據的採集後,首先,應依據對用戶行為的分類和管理員經驗,對用戶行為數據進行價值過濾和人工篩選,以提高行為數據的價值密度和可用性。其次,對用戶行為發生的時間、地點、方式、作用對象和結果進行定義,採用高效演算法對存儲於用戶行為事件大資料庫中的資源進行分析、判定,並對用戶行為的類型進行詳細定義。再次,應將已定義的用戶行為和用戶行為存儲大資料庫中的數據進行比對,進一步完善、規范用戶行為存儲大資料庫的資源。同時,利用用戶行為存儲大資料庫資源,對用戶行為分析與判定的規則實施反饋,完成對用戶行為分析、判定規則的動態修改與完善。最後,圖書館可依據讀者行為分析與判定的結果,明確讀者閱讀需求及其變化趨勢,為讀者提供個性化的閱讀推送式服務。
圖2-2 圖書館讀者行為分析與判定流程圖
個性化服務是一個不斷完善的過程,多次經過行為模擬和分析反復校準才能讓個性化服務盡可能貼近每一個用戶。如通過記錄用戶訪問某些專業內容來判斷為用戶推薦的相關內容或深度內容是否精準,就需要不斷地積累用戶在某專業內容上的行為記錄,記錄次數越多,記錄越精細,在下一次為用戶做個性化推薦時的精準度就越高。所以個性化服務所需的數據分析系統包括採集與感知都是循環起效的,這是一個閉環上升的垂直優化體系。
2.基於大數據的圖書館個性化服務讀者行為分析策略
(1)發現讀者需求及變化趨勢。大數據背景下,圖書館可通過監控設備、感測器網路和其他讀者行為採集設備,獲取讀者閱讀活動的服務內容與方式、閱讀終端與服務模式、閱讀社會關系組成、成員信息交流、論壇、博客、微博、微信朋友圈等社交網路上的思想表達、移動閱讀中讀者個體的行為路徑、感測器網路對讀者活動的記錄、服務系統的運行參數信息等數據,這些數據蘊含著巨大的社會和商業價值。因此,圖書館力圖採集讀者行為大數據,將讀者行為進行解析、描述和量化,最終實現對讀者服務需求、服務模式變化趨勢預測與控制。同時,圖書館應注重讀者行為數據分析的時效性,及時獲取讀者閱讀情緒和服務需求的變化數據,並將數據變化結果可視化表現出來,確保服務策略和內容隨著讀者個性化需求變化而動態調整。
(2)最大范圍的採集讀者行為數據。科學採集高價值讀者行為數據,是准確分析和預測讀者需求,提高讀者忠誠度和服務滿意度的關鍵。首先,圖書館應從讀者服務全局出發,收集讀者的行為數據,採集來自伺服器運行監控設備、感測器網路、用戶閱讀終端設備、系統運行日誌、讀者論壇與博客、讀者服務反饋系統、網頁cookies、搜索引擎、讀者閱讀行為監控設備的數據,盡量減少用戶行為數據採集的盲點,提高數據的完整性、精確性、及時性和有效性。其次,所採集的數據應具有海量和實時性特點,依據讀者閱讀需求對讀者行為分析的內容,選取數據和應用對象進行調整,避免讀者行為分析過程中可能會對讀者服務產生的消極影響,最終實現從理解讀者閱讀行為到掌握讀者閱讀需求的轉變。再次,圖書館應與第三方服務商合作,以服務協作和大數據資源共享的方式,努力拓展讀者行為數據採集的廣度和深度,在實現以讀者為中心的讀者行為數據選擇、過濾、共享和互補前提下,提高數據應用分析和增強數據的可用性。
(3)保證讀者行為數據的安全性和可用性。讀者行為數據具有海量、全面、高價值和實時性的特點,圖書館應加強對讀者行為數據的安全性和可用性管理,保證用戶保密信息和隱私數據的安全。但是,移動終端工作模式和使用環境的不確定性,嚴重影響了圖書館大數據閱讀服務的安全性,因此,必須加強閱讀終端的安全性管理。首先,圖書館應依據閱讀終端的安全設計標准及其移動性、開放性,以及閱讀終端與讀者閱讀行為的關聯性,為不同類型的閱讀終端劃分相應安全度,並通過嚴格限制閱讀終端的使用對象、安全模式、應用環境和通信方式來保證設備安全。其次,應將讀者行為數據劃分為用戶隱私數據、讀者特徵數據、行為日誌數據和公開數據四個安全等級,執行相應的安全存儲、管理和使用策略,並依據用戶行為數據生命周期發展規律,加強數據收集、存儲、使用、轉移和刪除五個環節的安全管理。再次,應堅持讀者需求精確感知、行為關系全面挖掘、服務模式發展准確預測和讀者行為科學分析的原則,實現讀者行為數據的良性監控和採集,避免採集與讀者閱讀服務保障無關的個人隱私行為數據。
(4)重點突出讀者閱讀行為數據挖掘的知識關聯分析。知識關聯分析就是從海量數據中發現存在於大量數據集中的關聯性或相關性,從而描述了一個事物中某些屬性同時出現的規律和模式,通過讀者閱讀行為數據的知識關聯分析,發現讀者不同行為之間的聯系,以及讀者的閱讀習慣和服務需求,是圖書館以讀者需求為中心制定服務策略的前提。圖書館應在三維空間開展讀者閱讀行為數據的交叉關聯分析,所涉及的主要內容包括讀者閱讀活動頻率、閱讀的時間與地點、閱讀內容分布規律、閱讀習慣和愛好、閱讀關鍵詞關聯度、閱讀社會關系交集、熱點內容的關注度等。同時,行為數據的選擇要堅持以服務保障為中心和高價值的原則,特別加強對讀者閱讀活動的熱點內容、主要閱讀模式和個性化服務需求反饋行為數據之間的關聯分析。此外,基於讀者閱讀行為數據挖掘的知識關聯分析,應加強對讀者閱讀行為的跟蹤和監控,在加強對讀者顯性行為特徵數據監控的同時,還應突出利用顯性行為數據挖掘,而獲得隱性行為信息。對讀者閱讀需求、閱讀熱點、閱讀行為關聯性等進行關聯分析,增強讀者行為知識關聯分析的廣度、深度和有效性。