姚宏斌(左)指导学生。中国科大供图
■本报记者 倪思洁
科学研究正在经历一场风暴。风暴源于狂飙突进的人工智能技术。“拥抱”还是“逃离”,成为摆在每位科研工作者面前的选择题。
在中国科学技术大学(以下简称中国科大),一群“野心十足”的年轻人选择了拥抱。他们聚焦于最传统的学科——化学领域,从一个个不起眼的念头出发,打破研究惯例,成果频登《自然》《科学》。他们要在这场科研范式的变革中,争当风暴的驾驭者。
最初的念头:让计算机帮帮忙
如果当初没有选择与计算机“联手”,中国科大教授姚宏斌团队最新发表于《自然》的论文,或许还只是份实验报告。
4月初,这篇论文一经发表便引起轰动。姚宏斌团队关于固态电解质新家族的研究,被认为有望实现电化学储能领域“圣杯”级的全固态锂金属电池。
姚宏斌等人试图寻找一种金属卤化物,以提升固态锂电池的效能。在寻找卤化物电解质的过程中,他们曾考虑将石榴石氧化物——锂镧锆氧中的“氧”换成“氯”,但怎么才能合成出这种化合物,并不知道。如果按照传统的化学研究方法,科研人员得窝在实验室一点点试错。什么时候能试对,也不知道。
姚宏斌想:“有没有可能让计算机帮帮忙?”
由于团队中没有能玩转计算机的人,姚宏斌开始搜罗人才。2021年,在研究生复试中,他相中了湘潭大学材料科学与工程学院本科毕业生罗锦达,因为他有计算机编程的基础并对其很感兴趣。
录取名单确定的当晚,姚宏斌拨通了罗锦达的电话:“我们有个材料体系很重要,需要用到计算化学的方法,你愿不愿意加入?我会联系老师教你。”
姚宏斌之所以如此主动,是因为这项做了4年的研究已经面临经费困境,不能再拖了。
挑到罗锦达后,姚宏斌很快又找到计算化学的“大牛”——中国科大讲席教授李震宇,并把罗锦达“塞”给了他。
在姚宏斌和李震宇的共同指导下,罗锦达写出了满足研究需要的程序。之后,姚宏斌团队联合李震宇团队,根据计算机模拟结果设计出一个常温条件下可以稳定存在的镧系金属氯化物。他们又跟随计算机的指引,在实验室成功合成具有优质性能的镧系金属氯化物固态电解质。
样品终于做出来了,可这只能算是一份“还不错的实验报告”。样品内部结构如何、锂离子在其中如何传导、这种固态电解质为何具有优质性能,都不知道。
此时,计算机的用处再次得以展现。基于分子动力学原理,团队成员把自己的实验数据和历史上相关研究的海量实验数据输入超算中心,经过长时间计算模拟和分析,最终探明镧系金属卤化物框架结构的锂离子传导原理。
“在这项研究中,模拟计算的分量约占三分之一。假设没有这三分之一,研究将无法令人满意,因为我们很可能无法合成最优的电解质材料,也无法把实验现象背后的原理解释清楚。”姚宏斌说。
论文评审人认为:“作者提出了一个全新的固态电解质结构材料,计算模拟非常完善。”
初尝模拟计算甜头后,姚宏斌茅塞顿开:“我们突然发现,还可以干点其他事。”
他们现在有了一个之前想都不敢想的计划:“把元素周期表里的很多元素按不同比例组合,或是在现有海量数据中寻找符合我们期望的材料,把材料做得更多样化。”
突破传统:把计算机训练成“化学家”
姚宏斌团队让计算机成为了“帮手”,而中国科大教授江俊的尝试,则把计算机训练成可以思考的“化学家”。
江俊并非化学科班出身,他最早学的是物理专业,之后慢慢转向理论与计算化学。跨专业曾让江俊有些不适应:“物理领域追求共性规律,但化学追求个性特质,每个实验室都希望做得跟别人不一样,越不一样越好。”
他给学生讲课时经常发现,今天刚讲完一个化学经验规则,第二天就出现了例外,“某某实验又打破了之前的理论极限”。
理论与实践的脱节,让江俊一度“很崩溃”。他开始尝试寻找这个古老学科中可能存在的共性规律。直到2014年,他看到了解决问题的可能——用大数据和人工智能做。
“化学之所以个性化、看不到规律,是因为它是一个高维度的复杂体系,任何一个微小条件的改变,都会引起整个体系的变化。”江俊说,“或许我们可以通过数据智能的方式建立一个‘化学大脑’,找到化学中的共性规律。”
这不是靠一己之力就能完成的。与姚宏斌当初的选择一样,他也开始四处寻找志同道合者。他的团队里,慢慢有了人工智能、电子科学技术、数学等各个方向的学生。他们以数据为切入口,编写智能程序、搭建数据库、建立知识图谱,让计算机逐渐能够读文献、做实验。
起初有人不屑地说:“不过是实现了自动化而已。”但经过8年摸索,机器化学家从1.0版本升级到2.0版本,“化学大脑”能做的事覆盖了文献阅读、实验设计、配方与条件优化等化学研究的整个链条。
机器化学家诞生后,江俊团队的第一次尝试,是让它计算和预测蛋白质光谱,这篇论文被《科学》杂志编辑部重点推荐。“一般来说,计算一个蛋白质光谱,要做1000多个动力学构象,每个构象都要算一个多星期。我们用机器学习的方式让机器化学家去做,从原先需要20多年缩短到一两个小时。”江俊说。
之后,江俊团队又让升级后的机器化学家做高熵催化剂等化学品与材料的创制。机器化学家从1.6万篇论文中,自主遴选出5种非贵金属元素,又从55万种可能的金属配比中找出全局最优解,将传统“试错法”所需的1400年缩短为5周。
国际同行评价认为,机器化学家的“网络操作系统、工作站和智能化学大脑都是最先进的”,并预计它“将对化学科学产生巨大影响”。
这些都让江俊觉得“当初的方向没定错”。及至2022年,“中国科学院年度团队”和“年度网信工作十大进展”的名单里,都出现了“机器化学家”的名字。
未来,他们的目标是推动中科院沈阳自动化研究所、中科院深圳先进技术研究院、中科院计算技术研究所、中国科大等联合组建智慧实验室。同时,他们还要和中科院文献情报中心、中科院自动化研究所、中科院信息工程研究所联手,打造全球化知识平台,形成精准智能化学的全场景解决方案。
除此之外,江俊内心深处还隐藏着另一份“野心”——他想通过机器化学家,理解乃至破解化学的高维依赖关系,并依靠强大的计算能力实现化学理论的创新和变革;他还想找出化学、物理、生物等学科的共通之处,从机器化学家衍生出机器物理学家、机器生物学家……
如今,在中国科大东校区理化大楼一个100多平方米的实验室里,名叫“小来”和“小福”的两位机器化学家,穿梭于不同的实验台和仪器之间。江俊感叹:“未来,科学家的核心竞争力或许不再是做实验的能力,而是更扎实的专业基础、更强大的理解力以及天马行空的想象力。”
掀起风暴:集中力量探索第四范式
和年轻人一样,中国科大单分子科学团队负责人、中国科大副校长杨金龙院士,看到了人工智能和大数据对化学学科造成的冲击,也看到了不同专业的年轻人“抱团”冲破科研传统束缚的尝试。
于是,2020年,在中国科大,“联盟”之事被提上日程。经过23次会议讨论,他们将中国科大现有的科研资源组合到一起,以建制化科研机构的形式集中力量探索化学研究的“第四范式”。
“范式变革”是科学界在意识到大数据和人工智能的冲击之后,常常提到的名词。它像一句警示,警告整个科学界,一场席卷学科世界观、价值观、方法论的风暴要来了。
在化学学科领域,150多年的发展历史被分成四个范式阶段——第一范式以实验为基础,通过实验观察和归纳总结发现化学规律,代表性研究是拉瓦锡发现质量守恒定律;第二范式以理论为基础,通过数学模型和理论框架解释化学现象,代表性研究是门捷列夫发现元素周期律;第三范式是运用计算机和人工智能模拟和预测化学过程和结果,代表性研究是量子化学计算、分子动力学模拟等;第四范式以数据智能驱动研究,如基于机器学习开展物质性质预测等。
“150多年的摸索中,化学研究主要依赖于‘试错法’,精准和高效是所有化学家的梦想。”李震宇说,每一次范式变革都促使计算机对化学领域的介入更进一步,精准智能化学成为实现化学学科跨越式发展的契机。
今年1月18日,中国科学院精准智能化学重点实验室(以下简称实验室)在中国科大正式成立,李震宇担任实验室主任。
实验室以中国科大化学学科为主体,发挥多学科交叉、“科教融合、院所协同”以及合肥大科学装置聚集的三大优势,聚焦“如何改变化学研究范式”的问题,探索建立化学研究精准化、智能化双驱动模式。
谈及第四范式的意义,李震宇打了个比方:“骑着自行车,累死了也骑不上月球,第四范式就好比造火箭,去以前去不了的地方。”
“我们希望把这个实验室建成一个精准智能化学领域国际顶尖的研究机构,形成一个新的精准自然化学范式,建立我们国家主导的精准化学数据体系和智能化学软硬件标准。”李震宇说。
目前,他们已经集聚了姚宏斌、江俊等来自理论计算、精准表征、智能化学、精准合成、物性调控等方面的研究团队。这些团队除了其成果都曾登上过《自然》《科学》外,还有一个共同点——与精准智能化学相关。
中国科大教授徐铜文带领的团队,在离子膜领域研究了近30年,最近又在《自然》刊发了一项新成果。“我们在材料物质选择和材料结构孔道调控设计方面,都依赖于精准化学相关的计算模拟方法。”徐铜文说,实验室为他们打开了交叉与合作的新窗口。
对于实验室主任李震宇来说,实验室前途是光明的,道路却是曲折的。作为一个依赖学科交叉才能发展的实验室,必须解决的一个重要问题是“如何才能吸引更多高水平合作团队和顶尖人才”。
“范式变革”概念最早的提出者、美国科学哲学家库恩曾说:“起初,新的范式候选者可能只有少数支持者,有时这些支持者的动机也是可疑的。然而,如果他们真有能力,他们将会改进它,探索它所有的可能性,并且表明在它的指导下,共同体将有什么样的前景。”
李震宇常常要在各种场合说服合作者加入和支持他们,不善言辞的他会用最简单朴实的12个字概括第四范式的前景和他们的态度,“拥抱化学精准智能化的未来”。
相关论文信息:http://doi.org/10.1126/science.2020.370.6521.twil
https://doi.org/10.1038/s41586-023-05899-8
https://doi.org/10.1093/nsr/nwac190
《中国科学报》 (2023-05-09 第1版 要闻)
文章来源:https://news.sciencenet.cn/sbhtmlnews/2023/5/374366.shtm