随着我们即将进入21世纪的第二个十年,我们面临着各种巨大的挑战——医疗卫生、教育、能源、环境、数据获取、网络安全和隐私等。但是我与本书的各位作者一样,坚信快速发展的科技能够帮助我们战胜所有这些挑战。
就像Jim Gray看到的那样,科学的第一、第二和第三个范式——实证的、分析的和模拟——已成功地带着人类走过历史。毫无疑问,继续依靠这些范式和技术会使我们继续前进。但是我们还需要新的方法来实现重大突破。我们需要做的是拥抱科学的第四个范式。
Jim对这个范式的愿景是一个以数据密集型科学为焦点的全新科学研究方法。现在,这一愿景正在成为现实。计算技术及其通过网络实现的连结性已经成为了几乎所有科学领域的基础。我们正在以数字形式聚集过去无法想象的海量数据——这些数据能够给我们带来深远的科研变革。同时,计算还处于一个破坏性技术进步的浪潮先锋——包括多核架构、客户端加云计算,自然用户界面和量子计算——这些技术都将为科学发现带来革命性变化。
数据密集型科学能够为众多领域带来突破。随着地球武装了越来越多的低成本、高宽带传感器,我们通过虚拟的“地球放大软件”能够对环境有更好的了解。 同样,太空也因为高宽带、可广泛获取的数据可视化系统而变得离我们更近了。计算技术与数据获取之间的良性循环将帮助我们更好地为大众普及关于地球以及宇宙的知识——使我们都成为科学体验的参与者,让所有的人都意识到其中的巨大好处。
在医疗健康领域,转向以数据为驱动力的改变将引发巨大的变革。我们将有能力在个人层面上对基因组和蛋白组进行计算化,从根本上改变行医方式。医疗数据将可实时获取,并根据不同的个体进行追踪、基准和分析,从而保证我们 获得的治疗完全是针对不同个人的。海量规模的数据分析将会增强实时监控疾病的能力和对潜在流行病做出反应的能力。我们的虚拟“地球放大软件”既可以用于研究我们自己,也可以用于研究我们的星球。所有这些技术进步都将帮助我们满足目前全世界40亿缺乏医疗服务人们的医疗需求。
计算能力的指数型增长也将大大加强科学家之间更加自然的交流。系统将能够更好地“理解”科学家们的各种工作,从而为他们提供过去只有人类助手才能提供的帮助。对于科学家来说,这将意味着取得更深入的科学见解,更丰富的发现,更快的突破。另一个技术进步就是那些巨大规模服务的出现,这些服务全部放在云端,并能够与所有种类的客户端计算机连结运作。这种基础设施将从整体上加强科学家的数据发布系统——为他们提供可视化、 分析以及与数据互动的新途径,进而使科学家之间的交流和协作更加便利。
基础架构的增强也将使得一个真正的全球数字图书馆变得可能,在这个图书馆中学术研究的整个生命周期——从开始研究到论文发表——都会在电子环境中进行、而且对所有人开放。在科学想法的发展和随后的发表过程中,科学家们将能够在虚拟环境中与任何其他人交流——分享数据源、 工作流以及研究成果。同样,读者也能自己对某一出版物进行导航,并且很容易地看到相关的报告,以及支持性数据、视频、 音频、数据以及分析等——所有这些都在网上。科学界的出版业也将变成一个全天24小时、 一周七天的全世界实时互动体验。
看到科学家和计算机学家们共同努力来迎接我们这个时代面临的挑战,我感到非常受鼓舞。他们的共同努力将会对我们的将来产生积极且深远的影响。