1. 健康医疗大数据的安全与应用
健康医疗大数据的安全与应用
医疗健康大数据是覆盖自然人的全生命周期,既包括个人健康,又涉及医药服务、疾病防控、健康保障和食品安全、养生保健等多方面数据的汇聚和聚合。
简单讲就是涉及到健康的、医疗的跟个人相关的数据的合集,不仅在医院,在互联网,在企业、医院都存在。
同时会议上也提到要利用健康医疗大数据,创新业态,创新应用,促进医疗行业发展。
利用健康医疗大数据,不仅对改进健康医疗服务模式,而且对经济社会发展都有着重要的促进作用,是国家重要的基础性战略资源。
健康医疗数据从哪来?
我们可以大致分为五方面。
第一来自诊疗数据:
患者在医疗机构、体检机构等就医过程中产生并由信息系统记录的数据;
包括电子病历、检验检查、基因测序、用药、医学影像等;
第二来自研究数据:药品或器械研究机构,由研究机构录入或采集的个人健康数据,比如临床试验、生物样本库等;
第三是个人数据:个人在医疗机构外自行记录的健康数据,比如可穿戴设备采集的心率、脉搏、睡眠等数据;互联网行为记录的检索、问诊、查询、病患交流数据等;
第四是结算数据: 由商业保险公司、医保机构、物价管理机关存储的报销和流通数据;最后是公共医学:由临床指南、医疗健康期刊、医学文献,循证医学数据资源库等组成。这就是医疗大数据的来源。
健康医疗数据核心在医疗机构
因为医院的数据是真实的疾病数据,其他的社会药品采买数据等等跟真正核心医疗健康的核心还有些距离。
而在医院包括护理记录、电子病历、用药信息、疾病诊断等等,这些数据综合一个特点就是敏感度非常高。
第二就是真实,为什么真实?看病有医嘱、处方、病案等,这些医疗文书是可以作为法律证据的。
同时质量比较高,在医疗信息化20年时间的不断积累和持续改进,数据的完整度和质量也在不断地提高。
行业要求
医疗健康大数据据作为新生事物,在行业标准和行业规范上尚有欠缺。直至近一年,国家卫计委陆续出台的全国医院信息化"功能指引"和"建设标准和规范",其中提到大数据平台,就是希望医院须要建设大数据平台,执行国家十三五规划中大数据战略落地的内容和时间计划,要求三甲医院最终要建设面向大数据和人工智能技术的服务架构,高效高质组织数据资源,形成数据生产力。
行业现状
健康大医疗数据共享及应用不易。
针对于医院来说:客观存在"不敢、不愿、不会"三种形态。
不敢,因为数据共享、数据安全这些问题没有解决,所以不敢去做。
没有规定,或者不太明确,不敢做。不愿,因为医院权益、政府权益、社会权益,不清楚。还有医院内部科室的数据担心被拿走,不愿意。
不会,因为大数据必须要有大数据的技术支撑,没有技术支撑就没法儿对数据进行挖掘和利用,同样在数据共享开放过程中,技术、标准、机制、体制突破仍存在较大的障碍,造成各部门在推动过程当中不会做,这些现状造成了「不会」现象。
这些都是现状,但核心是数据安全和无法做到安全可控,让医院放心。
安全和隐私保护
数据安全挑战
数据安全没有解决,能不能用?怎么建立安全体系?
首先医院安全受到不断的挑战。
我在昨天看到一个新闻,我不知道大家看到没看到,就是新加坡的某医院集团,其医院数据被黑,包括他们总理在内的就诊数据都在里面,非常敏感。
黑客拿走了。
为什么大家盯到了医院?说明黑客对医疗数据还是感兴趣的。
比如勒索数据,过去病毒很少到医院,但去年勒索病毒刚爆发时就是针对医院,英国到中国都有中招,但是中国医院被曝光的很少。所以说安全形势比较严峻。
医院安全管理
第一是物理安全
医院的网络物理网是分内部网:挂号、结算、收费。一个是外网办公网,再往外才是英特网。
整个物理是隔离的,而且网络也是隔离的。
第二数据安全,主要是指医疗内部数据,数据保护采用了加密、数据库审计、防篡改等技术。
第三是网络安全,从网络角度讲,国家卫计委提出2015年全部三甲医院要建立信息安全三级等级保护,逐步实现了基本的安全。
第四隐私安全,这是新的命题,因为我们数据在内部用的话是不去隐私的明文。
那些是隐私数据?
国内还没明确法律规定细则。
我们可借鉴美国HIPPA法案,其明确规定了个人姓名、社保号、车牌号等18项隐私数据,或者说只要能指向患者个体的都算隐私。
那么数据如何去隐私?
现在通用的还是基本加密技术。
医院内部不需要加密,所谓外部就是科研研究、药物研究时需要大量统计分析时需要加密,我们现在用的是MD5加密等机密技术,有可逆的和不可逆的。
健康大数据应用
在安全前提下要放开应用。
借用国家卫计委规划信息司领导所言"一分部署、九分落地"。健康医疗大数据也需要一分建设,九分要应用。从产业应用现状看,公司多,投资多,期望大,产出还未确定。
从应用方向上,我们可以分为:临床决策支持(AI),医保控费和险种开发,医院管理,医疗器械和新药研发,慢病和健康管理等多个方向。
2. “互联网+”健康医疗大数据产生的影响
随着“互联网+”战略的不断推进,我国的医疗行业迎来了“互联网+”医疗时代。 “互联网+”是互
联网在各个领域的创新应用,以互联网为载体,以新信息技术为手段,在医疗领域的应用,涵盖了医疗的健康教育、信息查询、健康档案、疾病风险评估、在线咨询、远程会诊、远程医疗、疾病康复等诸多方面。医疗大数据是在医疗服务过程中产生的与临床和管理相关的数据,时序性、隐私性、不完整性等医疗领域独有特征。
2018 年 4 月 29 日国务院办公厅正式发布《关于促进“互联网+医疗健康”发展的意见》,提出“健全基于互联网、大数据技术的分级诊疗信息系统,推动各级各类医院逐步实现电子健康档案、电子病历、检验检查结果的共享,推动大数据在不同等级医疗卫生机构间的授权访问和利用。”
目前,医疗大数据已在优化资源配置、解决信息孤岛问题、辅助决策应用等方面呈现出巨大作用。总结下来,产生如下影响:
1、提升就医体验
“就医难”是国内医疗面临的最大问题。 以互联网为载体的就医过程,优化了就诊流程,缩减等待时间,还能有效提升患者就医体验,贯穿医疗服务的全过程,涵盖了医疗资源查找与匹配、网上挂号、在线问诊、远程诊疗、医药电商、移动医疗等领域。
2、推进精准医疗
精准医疗强调以个体化医疗为基础,包括精准诊断和精准治疗两个方面。 互联网环境下,医疗服务的逐步数字化将极大地促进医生与患者之间的相互了解。
3、促进医疗体系的协同
分级诊疗制度是当前卫生行政部门深化医药卫生体制改制的重要内容。 分级诊疗能够合理配置医疗资源、促进基本医疗卫生服务均等化。 “互联网+”医疗环境下,借助互联网手段实现分级诊疗成为医改的核心。 医院的“信息孤岛” 问题在很大程度上阻碍了分级诊疗制度的推进,因此打破医疗信息孤岛是“互联网+”医疗发展的基础。
4、推动个性化医疗发展
未来将建成各种数据无缝流转,以患者为中心的覆盖全生命周期的医疗健康管理服务,多个机构、多个角色可基于个体的完整健康数据实施共同管理,实现对患者的个性化治疗。
参考文献:段金宁.“互联网+”医疗环境下的健康医疗大数据应用[J].中华医学图书情报杂志,2018,27(06):49-53
3. 从大数据平台到数据治理,智慧医院大数据何去何从
背景:上周看了阿里章剑锋写的一篇大数据文章,加上对健康医疗大数据相关政策的分析,想就医院大数据的建设说几点看法,毕竟国家健康大数据战略下智慧医院大数据是必然先驱,有大数据抱负的医院信息科大部分还在摸着石头找过河的路,而其他行业的经验还是很有借鉴意义的。
2019年6月,中国卫生信息与健康医疗大数据学会会长金小桃(中国卫生信息学会会长)在6月20日的2019(14th)中国卫生信息技术/健康医疗大数据应用交流大会上发布《新一代医院数据中心建设指南》(尽管找遍网络都没找到这个指南,可能还在整理中...)
而基本同一时间,国家卫健委统计信息中心初版了《医院数据治理框架、技术与实现》,对“医院大数据”明确为“医院数据”,这也是我一直在解释的名词,正符合大数据的正确引导和深度理解。
2019年的厦门CHIME,中国医院协会信息专业委员会发布了《医疗机构医疗大数据平台建设指南(征求意见稿)》。在结合2015年以来的每年一批的健康医疗大数据国家战略政策指导,大数据国家战略的决心和国家支持引导的力度可见一斑,而医院侧信息化的现阶段热点就是医院信息平台,信息平台的热方向就是医院大数据和人工智能,当然这脱离不了首先建设完备的医院信息化系统。我们再来看一个政策:
2018年4月,国家卫生健康委员会规划与信息司发布了《全国医院信息化建设标准与规范(试行)》。它是在2016年《医院信息平台应用功能指引》和2017年《医院信息建设应用技术指引(试行)》基础上,形成的较为完整的医院信息系统体系框架。在《医院信息平台应用功能指引》明确医院信息化功能和在《医院信息化建设应用技术指引》上明确了医院信息化技术。看医院信息化完整地图,云计算、大数据、物联网以及传统信息化支撑的是金字塔顶端的人工智能,最近几年AI大数据经常被一起称呼,不可能脱离信息化基础和大数据基础去建设AI的空中楼阁。所以大数据和AI找同一厂家(或者同一生态圈)建设会是最好的选择,毕竟做AI的一定先做数据,但是做数据的却不一定做得好AI,看市场上那么多数据搬运工公司就清楚了,这也是造成医院大数据前期建设重数量轻质量的主要原因。
再来看大数据的宏观发展环境,从2009年闪亮登场到2015年泡沫顶峰,已经迈过了甘特曲线的2个关键节点,现在正处于稳步发展。
大数据技术的2个维度是我觉得章剑锋最深刻的大数据概念解析,垂直的技术栈维度和水平的数据流维度,也就是垂直的平台+应用,水平的数据处理。何为大数据?这一轮数据到大数据的概念,水平维度的数据处理理论正式出现已经30年了并没有大变化(这个维度数据大数据都应该称为数据处理),而聚变的是技术栈维度:hadoop、spark、storm、flink等等,但是闪亮的hadoop不也在没落么,因为技术为业务而生,符合业务需求的才是最合理的技术。而医院大数据建设出的第二个比较大的问题就是追求新技术典型如hadoop,就医院数据体量和应用需求,hadoop真不是最佳实践,而繁杂的运维和庞大高昂的资源硬件成本可能是压垮信心的根本原因。
再来看医院大数据上云,尽管很多人觉得国内是数据隐私和数据安全比较宽松的环境,但是医院数据侧一直都比较谨慎。虽然最近国内出了政策,允许医院将患者数据对患者开发,但是把医院数据放在厂家提供的云上,对于大型三甲医院目前依然不现实。医院除了诊疗水平,最重要的资产就是医院数据,医院数据又比较敏感,医院本身是要遵从严格监管的,所以按照当前形势,更适合医院的还是数据在医院(很多医院通过免费大数据战略合作协议让医院数据上医某云)。
还是回到大数据平台,伴随着大数据概念火热,hadoop缺在逐步没落,就大数据技术栈本身,不存在hadoop架构和oracle架构的选择(在这个点上大量概念混淆,oracle和hive HDFS只是存储方案的差异,hadoop是大数据完整技术栈),只存在数据存储架构的选择,根据数据量、数据使用方式、数据分析方式决策更合理的架构,选了hadoop就不能用oracle吗?这是医院大数据平台建设里经常混淆的点。根据应用场景选择存储方案,根据数据分析需求选择技术栈,如果不清楚需求,何不来个混合架构搞个万金油?其实医院大数据,oracle是可以用的,国产化另论。如果定了oracle是不是就不能用hadoop了呢?
这里又引申到另一个问题,Hadoop、Spark、Flink等大数据技术的发展,医院大数据建设技术要求必提,但是真正建了之后会发现好像哪里不对劲,难道大数据就是这么高大上到信息科要大量学习新技能吗?能用的技术才是好技术,自己都用不了的一定有问题。其实医院信息科真正需要的不应该是Hadoop、Spark、Flink等大数据技术的堆砌,应该是信息科都可以简单上手操作做数据治理,以这些技术为基础的能解决业务问题的产品。也即真正的易操作、专业化、流程化、全链路的数据平台(绝对不是hadoop),这个平台准备后续专门介绍。
智慧医院从大数据平台的建设到数据治理平台建设,大部分是从技术栈的hadoop转向数据专业治理本身,也就是从垂直的技术栈维度转换为横向的数据流维度,还是要平台,而此平台已经不再hadoop。数据治理到底如何做呢?参见前一篇文章《如何做数据治理》,数据治理最早成熟应用是在零售业、银行业,以及运营商,现在每个AI互联网公司都会有数据部门,医院数据治理可能还是先解决自身的业务问题本身,能不能发展到数据中台,还要看医院战略,而不是各种广告中的概念。
还有一点需要补充的,中美贸易摩擦,美对中进行了严格的出口管制,无论从硬件还是软件,能支持国产化会是一个更好的选择。
最后,数据治理本身是一个重运维重交付重实施的事情,当前市场大量充斥草台班子的数据搬运,没有深度长期的价值挖掘,再好的搬运工做的也是劳民伤财的事,参考谷歌和梅奥的十年战略合作协议,这才是医院大数据真正有远见的规划。
简单总结下,智慧医院大数据发展趋势:
1. 政策会频繁颁布,医院大数据(数据)建设一定是必然,目前已经开始稳步发展;
2. 大数据平台概念会褪去,医院真正需要的一定是全产业链整合的数据管理平台;
3. 智慧医院会更加重视数据流即数据治理本身,现阶段还需要一套简单上手的平台辅助;
4. 智慧医院大数据中心依旧以私有云机房为最佳方案;
5. 智慧医院大数据中心需要兼容国产化需求;
6. 找一家AI大数据公司作为长期战略合作伙伴将更加现实,毕竟只讲大数据的大部分都是数据搬运工;
4. 大数据医疗具体是指什么
医疗大数据是个很宽泛的概念,他有很多详细的分类,包括:电子病历数据,这是患者就医过程中所产生的数据,包括患者基本信息、疾病主诉、检验数据、影像数据、诊断数据、治疗数据等,这类数据一般产生及存储在医疗机构的电子病历中,这也是医疗数据最主要的产生地。电子化的医疗病历方便了病历的存储和传输,但是并未达到进行数据分析的要求。大约80%的医疗数据是自由文本构成的非结构化数据,其中不仅包括大段的文字描述,也包括包含非统一文字的表格字段。通过医学自然语言理解技术,将非结构化医疗数据转化为适合计算机分析的结构化形式是医疗大数据分析的基础。电子病历中所采集的数据是数据量最多、最有价值的医疗数据。通过和临床信息系统的整合,内容涵盖了医院内的方方面面的临床数据集。在电子病历的互通互联上,出于各自的利益性(限制病人转诊),各大电子病历企业也不愿意使数据互通互联。根据美国政府相关报告显示,其电子病历共享比例也仅为30%左右。
检验数据
医院检验机构产生了大量患者的诊断、检测数据,也有大量存在的第三方医学检验中心也在产生数据。检验数据是医疗临床子系统中的一个细分小类,但是可以通过检验数据直接患者的疾病发展和变化。目前临床检验设备得到迅速发展,通过LIS 系统对检验数据进行收集,可以对疾病的早发现早诊断和正确诊断做出贡献。
影像数据
随着数据库技术和计算机通讯技术的发展,数字化影像传输和电子胶片应运而生。医疗影像数据是通过影像成像设备和影像信息化系统产生的,医院影像科和第三方独立影像中心存储了大量的数字化影像数据。医学影像大数据,是由DR、CT、MR 等医学影像设备产生所产生并存储在PACS 系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。与检验信息系统(LIS)大数据和电子病历(EMR)等同属于医疗大数据的核心范畴。医学影像数据量非常庞大,影像数据增速快,标准化程度高。影像数据和临床其他数据比较起来,它的标准化、格式化、统一性是最好的,价值开发也最早。
费用数据
医院门诊费用、住院费用、单病种费用、医保费用、检查和化验收入、卫生材料收入、诊疗费用、管理费用率、资产负债率等和经济相关的数据。除了医疗服务的收入费用之外,还包含医院所提供医疗服务的成本数据,包含药品、器械、卫生人员工资等成本数据。在DRGs 按疾病诊断相关组付费模式中,需要详细的成本数据核算。通过大样本量的测算,建立病种标准成本,加强病种成本核算和精细化成本管理。
基因测序数据
基因检测技术通过基因组信息以及相关数据系统,预测罹患多种疾病的可能性。基因测序会产大量的个人遗传基因数据,一次全面的基因测序,产生的个人数据则达到300GB。一家基因测序企业每月产生的数据量可以达到数百TB 甚至1PB。
智能穿戴数据
各种智能可穿戴设备的出现,使得血压、心率、体重、体脂、血糖、心电图等健康体征数据的监测都变成可能,患者的单一体征健康数据以及运动数据快速上传到云端,而且数据的采集频率和分析速度大大提升。除了生命体征之外,还有其他智能设备收集的健康行为数据,比如每天的卡路里摄入量、喝水量、步行数、运动时间、睡眠时间等等。智能穿戴设备虽然在这两年遇冷,用户很难形成粘性,但是并不意味着智能穿戴设备所产生的数据没有意义。提供健康数据和服务,可能是智能穿戴厂商未来的转型之路。健康大数据的收集必须依靠硬件载体,智能穿戴设备还将会遇到自己的第二春。
体检数据
体检数据是体检机构所产生的健康人群的身高、体重、检验和影像等数据。这部分数据来自医院或者第三体检机构,大部分是健康人群的体征数据。随着亚健康人群、慢病患者的增加,越来越多的体检者除了想从体检报告中了解自己的健康状况,还想从体检结果中获得精准的健康风险评估,以及如何进行健康、慢病管理。
移动问诊数据
通过移动设备端或者PC 端连接到互联网医疗机构,产生的轻问诊数据和行为数据。曾经通过互联网问诊企业春雨医生的数据,分析各地医生互联网问诊的活跃度、细分疾病种的问诊行为。通过这些数据的分析,对行业发展、互联网问诊企业的决策有非常重要的帮助。
5. 人工智能和大数据技术在医院慢病管理中起到了什么作用
在慢病领域,通过AI创新应用促进慢性病积极管理,用信息化的手段提高医疗服务的安全质量猛纤,缓解医疗资源的不平衡,更能够有效推动主动健康管理与服务的发展,实现医保治理效能的提升。
智慧眼围绕慢病管理的痛点,通过AI、大数据、智能设备手段的介入,为慢病管理带来了新的思路。
AI+大数埋数据能力,提高慢病服务效率。
将治疗服务延伸至院外,通过慢病管理平台提升医院的服务效率。通过打通院内外系统及物联网设备中的数据,汇总患者包括健康状况、病情发展、用药记录、治疗手段、过敏反应等信息,利用AI算法循证医学知识图谱,对数据进行智能化分析,形成慢病患者生理指标、代谢和行为关联的数据模型,为后续的诊疗提供依据和便利。
IoT感知,慢病管理更精准。
在医疗场景,IoT设备解决了数据持续监测的问题,可以让医生获取更完整的监测数据完成诊断和治疗,实现“院内+院外“的一体化服务。智慧眼结合智能物联设备,通过线上智能互动方式引导患者进行病情自测,枝毕仿健康数据上传,智能定制个性化健康管理方案,实现人机交互,精准追踪患者健康状态,提高医疗服务质量。
6. 大数据能给医疗带来哪些改变_大数据在医疗方面的作用
如慧迟今是大数据时代,前景自然好了,据前瞻产业研究院《2016-2021年中国行业大数据市场发展前景预测与投资战略规划分析报告》显示,总的来说,医疗大数据应用主要体现在临床操作、研发、新的商业模式、付款/定价、公众健康五大领域,在这孙碧基些场景中,大数据的分析和应用都将发挥巨大的作用。
医疗大数据的应用对于临床医学研究、科学管理和医疗服务模式转型发展都具有重要意义,而大数据技术的运用前景是十分光明的。
医院和医疗行业面临的大数据主要有医学影像、视频(教学、监控)及文献等非结构化数据。由于这些数据增长很快且结构复杂,给数据管理和利用带来较大的压力,存储与管理成本不断提高,数据利用困难、利用率低。除了数据数量和形态的迅速增加,医疗数据还需要越来越长的保留期。一旦存储系统的安全性出现问题,导致医疗数据丢失,医院会面临严重不良局面。医疗大数据的应用要保证数据的全面性、准确性、实时性和使用的便捷性,要能快速运算和快速展现,要与日常工作平台紧密结合。
国人已经把健康大数据上升为国家战略,而面对“大数据”的挑战,医院必须考虑三大主要问题。
(1)数据存储是否安全可靠?因为系统一旦出现故障,首先考验的就是数据的存储、灾备和恢复能力。如果数据不能迅速恢复,而且恢复不能到断点,则将对医院的业务、患者满意度构成直接损害。
(2)如何提高医院运行和服务的效率?提高效率就是节省医生的时间,从而缓解医疗资源的紧张状况,在一定程度上可以帮助解决“看病难”的问题。
(3)如何控制大数据的成本?存储架构是否合理,不仅影响医院IT系统的成本,而且关乎医院的运营成本,医疗数据激增,使医院普遍存在着较大的存储扩容压力。如今,医院的存储设备大多是由不同厂商构成的完全异构的存储系统。这些不同的存储设备利用各自不同的软件工具来进行控制和管理,这样就增加了整个系统的复杂性,使管理成本非常高。
未来,大数据必将影响医疗行业,未来医疗行业的大数据将会具体应用在:临床辅助决策,则谨医疗质量监管,疾病预测模型,临床实验分析。其发展空间有:个人健康门户,慢病管理和健康管理,电子病历和临床质量监控,医学知识管理,临床路径和循证医学,远程医疗和移动医疗,医学研究数据仓库和共享平台,跨医疗机构协作平台。