如果大数据分析和可预测模型可以在医药保健行业能得到充分运用,那么人类就能拯救更多生命。
调查显示,分析Twitter的数据比传统方法能更快地预测到当年海蒂的霍乱疫情。
现在,随着数据科学技术与开源软件的不断发展,生物信息学领域正经历着翻天覆地的变化。根据美国政府的数据,全美电子病历的使用率较2008年大幅提升。96.9%的非政府急救中心都采用了经认证的电子病历系统,而基本电子病历系统使用率从2008年的9.4%猛增到2014年的75.5%。近年,除了电子病历以外,像基因组学、蛋白质组学、新陈代谢学、转录学等科学领域都有飞速发展。现在我们已经非常擅长收集数据,比如有些基因组组织的数据库大小达到100PB。想象一下在未来,医生仅从便携设备和院内传感器数据中就可以得到大量信息。有这样的数据支持,医生能快速、全面地了解病人,而这样的看病方式今后会真正普及。然而,相应的技术成本也会提升。像核磁共振、超声波、超声心动图等物理疗法,都是需要复杂的成像技术并储存高清图片。一个显微镜图片可以有1TB大,而更高清的图片也时常会有。这样的高清图片趋势加大了数据储存和计算的成本。
生物信息学的发展方向是采用数据预测模型指导行动,以改进应用方案或流程。像便携式心脏监测器应用程序可以记录数据,并采用预测模型防止心脏病突发;一个RFID程序标签可以提醒医生手术工具没有配齐。同样,药片、隐形眼镜都可以收集数据。Novartis公司正在该领域进行尝试,他们正在研发机器人药片运送技术和智能隐形眼镜产品。
生物信息和医疗传感器所需要的程序架构
我们需要优秀的程序架构,准确的模型、通用数据平台来实现数据即时分析。现在大多正在使用的数据技术都已经过时了。
过去,关于生物信息的问题都是由大量CPU来处理,但是其程序架构却不能支持TB或PB级别的数据,传统的编程语言也不适合处理超大量的数据。同时,工作人员时常需要将原始数据转移到别处进行处理,而之后又将结果数据转移回来,而这样超大量的输入输出不是传统的架构所能承受的。
新的架构是采用大量平行处理数据库,在分布式环境中储存并处理数据,让数据尽可能少进行位置转移。在这个方面,Pivotal的Greenplum数据库相当先进。它利用开源PostgreSQL数据库并附加了高级跨节点储存功能,能让每个节点单独处理请求,并最终整合所有节点得出结果。
(图为Greenplum平行处理图解)
大量平行处理技术非常适合扁平格式的数据,但当数据是其他格式时,ApacheHadoop®能解决这个问题。它可以容纳大量非结构化的数据,不论是图片还是文档都可以。和平行处理技术一样,HadoopMapReduce也是将数据分到数个节点进行处理后再整合出结果。MapReduce最初是为批量处理设计的,它有磁盘访问延迟,而在绑定任务的时候延迟较高。
Hadoop的磁盘和批量属性使ApacheSpark®有机会发挥它的功能,例如故障容差、分布储存、内存计算等等。该软件提取弹性分布数据集,可以把数据储存在多个设备的内存中,避免高频磁盘读取,能在多个负载之间重新使用数据。这样,及时处理的延迟就可以降到很低。
这些平台的广泛运用推动了包括MADlib、MLib、GraphX等机械学习文件库的发展,继而让R、Phython等单线程应用程序可以在平台上使用了。
在运营预测模型中采用即时数据分析
这些新架构不仅加快了传统数据研究,还带来了新的分析技术,并能使我们通过即时数据分析来改善医疗环境甚至拯救生命。这样的即时架构能支持预测性评估,并指导相应预防措施,从而降低成本、减少出错几率、预防意外事故、提升护理质量。例如,系统可以实时监测急诊等待时间、二诊等待时间、病人逗留时间、医院患者人数等重要指标来判断医院的运营状况。
在计划怎样利用数据时,以下问题值得思考:
可用数据有哪些?
可用数据什么时候能到位?
能直接实施的数据有哪些,什么时候可用?
基于现有数据和模型的预测足够准确吗?
我们能尽快做出预测并采取相应措施吗?
我们能改变抓取数据的方法,从而得到更多数据,改善数据,并利用数据来优化流程吗?
认真问问自己上面的问题,并一一用行动来回答,当下的状况就能得到改善。今天通过数据,我们可以预测病人在医院的逗留时间长度,预测病人器官的健康状况,甚至预测其他更复杂的情形。不论数据大小、格式、结构,只要将数据全部整合在一起,我们就能监测医院内的各项细节,例如是否每个人都认真洗手、药品是否发放正确,甚至可能直接为病人开出更有效的药方。我们还可以利用腕带式传感器监测人体排汗系统、体温系统、糖尿病人血糖指标,在必要时发出警报以避免病情突发。
虽然现在的数据科学技术已经很强大,但像科技创新、技术访问、技术成本、数据隐私、数据安全、规章制度、病人意愿等等问题都亟待解决。
但我们相信,科学技术按照目前的状况发展下午,人类在未来一定能拯救更多生命,并提高人类的生活质量。
欢迎关注上方PivotalChina微信号
欢迎关注上方PivotalChina新浪微博
我们会定期分享关于云平台和大数据的信息
您也可以通过微信或微博直接联系我们