⑴ 大數據醫療具體是指什麼
醫療大數據是個很寬泛的概念,他有很多詳細的分類,包括:電子病歷數據,這是患者就醫過程中所產生的數據,包括患者基本信息、疾病主訴、檢驗數據、影像數據、診斷數據、治療數據等,這類數據一般產生及存儲在醫療機構的電子病歷中,這也是醫療數據最主要的產生地。電子化的醫療病歷方便了病歷的存儲和傳輸,但是並未達到進行數據分析的要求。大約80%的醫療數據是自由文本構成的非結構化數據,其中不僅包括大段的文字描述,也包括包含非統一文字的表格欄位。通過醫學自然語言理解技術,將非結構化醫療數據轉化為適合計算機分析的結構化形式是醫療大數據分析的基礎。電子病歷中所採集的數據是數據量最多、最有價值的醫療數據。通過和臨床信息系統的整合,內容涵蓋了醫院內的方方面面的臨床數據集。在電子病歷的互通互聯上,出於各自的利益性(限制病人轉診),各大電子病歷企業也不願意使數據互通互聯。根據美國政府相關報告顯示,其電子病歷共享比例也僅為30%左右。
檢驗數據
醫院檢驗機構產生了大量患者的診斷、檢測數據,也有大量存在的第三方醫學檢驗中心也在產生數據。檢驗數據是醫療臨床子系統中的一個細分小類,但是可以通過檢驗數據直接患者的疾病發展和變化。目前臨床檢驗設備得到迅速發展,通過LIS 系統對檢驗數據進行收集,可以對疾病的早發現早診斷和正確診斷做出貢獻。
影像數據
隨著資料庫技術和計算機通訊技術的發展,數字化影像傳輸和電子膠片應運而生。醫療影像數據是通過影像成像設備和影像信息化系統產生的,醫院影像科和第三方獨立影像中心存儲了大量的數字化影像數據。醫學影像大數據,是由DR、CT、MR 等醫學影像設備產生所產生並存儲在PACS 系統內的大規模、高增速、多結構、高價值和真實准確的影像數據集合。與檢驗信息系統(LIS)大數據和電子病歷(EMR)等同屬於醫療大數據的核心范疇。醫學影像數據量非常龐大,影像數據增速快,標准化程度高。影像數據和臨床其他數據比較起來,它的標准化、格式化、統一性是最好的,價值開發也最早。
費用數據
醫院門診費用、住院費用、單病種費用、醫保費用、檢查和化驗收入、衛生材料收入、診療費用、管理費用率、資產負債率等和經濟相關的數據。除了醫療服務的收入費用之外,還包含醫院所提供醫療服務的成本數據,包含葯品、器械、衛生人員工資等成本數據。在DRGs 按疾病診斷相關組付費模式中,需要詳細的成本數據核算。通過大樣本量的測算,建立病種標准成本,加強病種成本核算和精細化成本管理。
基因測序數據
基因檢測技術通過基因組信息以及相關數據系統,預測罹患多種疾病的可能性。基因測序會產大量的個人遺傳基因數據,一次全面的基因測序,產生的個人數據則達到300GB。一家基因測序企業每月產生的數據量可以達到數百TB 甚至1PB。
智能穿戴數據
各種智能可穿戴設備的出現,使得血壓、心率、體重、體脂、血糖、心電圖等健康體征數據的監測都變成可能,患者的單一體征健康數據以及運動數據快速上傳到雲端,而且數據的採集頻率和分析速度大大提升。除了生命體征之外,還有其他智能設備收集的健康行為數據,比如每天的卡路里攝入量、喝水量、步行數、運動時間、睡眠時間等等。智能穿戴設備雖然在這兩年遇冷,用戶很難形成粘性,但是並不意味著智能穿戴設備所產生的數據沒有意義。提供健康數據和服務,可能是智能穿戴廠商未來的轉型之路。健康大數據的收集必須依靠硬體載體,智能穿戴設備還將會遇到自己的第二春。
體檢數據
體檢數據是體檢機構所產生的健康人群的身高、體重、檢驗和影像等數據。這部分數據來自醫院或者第三體檢機構,大部分是健康人群的體征數據。隨著亞健康人群、慢病患者的增加,越來越多的體檢者除了想從體檢報告中了解自己的健康狀況,還想從體檢結果中獲得精準的健康風險評估,以及如何進行健康、慢病管理。
移動問診數據
通過移動設備端或者PC 端連接到互聯網醫療機構,產生的輕問診數據和行為數據。曾經通過互聯網問診企業春雨醫生的數據,分析各地醫生互聯網問診的活躍度、細分疾病種的問診行為。通過這些數據的分析,對行業發展、互聯網問診企業的決策有非常重要的幫助。