近日,中科大机器化学家团队通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,成功研制出“全球首个数据智能驱动的全流程机器化学家平台”。
随着化学研究的对象日益复杂化、高维化,传统研究范式成本高、周期跨度长的问题日益突出。近年来,科技界逐渐意识到数据对于学术研究和产业创新发展的重要意义,而大数据科学与人工智能技术结合的手段,也在先进材料研发中崭露头角。
江俊教授及其团队提出“机器科学家”概念,希望发挥其数据驱动和智能优化的优势,从数以亿计的可能组合中找到最优解来加快材料研发。团队分工明确,配合默契,一路乘风破浪,几位有交叉学科背景的年轻在读博士已经成长为团队“顶梁柱”:肖恒宇设计出软件框架;张百成编写程序,让机器人读论文、提出科学假设、形成实验报告和方案;赵路远主攻电化学测试,负责烘干仪器、光谱仪等硬件的驱动程序开发。
良好的思路为科技研发指引了方向,前进的路程并非一帆风顺。25岁的赵路远学电子科学技术出身,在她看来,克服科研难题主要靠毅力。她和师弟曹嘉祺一起编写某驱动程序时,由于信息掌握不充足,无法准确理解调用接口,在反复联系仪器厂商和代理商没有得到回应后,决定自力更生。两人耗时3周,夜以继日,条分缕析做了3000次发送信号、等待反馈、记录响应等尝试,逐步逆向试出底层控制逻辑,成功实现了对机器人的远程控制。
2021年,团队信心满满地开始机器人首次试运行,结果差强人意,化学设备单独运行正常,但参与系统联调时却无法使用,团队通宵达旦排查原因,仍无头绪。山重水复疑无路,柳暗花明又一村,肖恒宇想到化学设备和机械臂均使用了红外探测设备,可能会互相干扰。于是,他将机械臂换一个朝向,轻松解决了问题。往后的开发调试中,不同领域的仪器设备,不同系统的代码协议间,都出现了类似的 ‘磨合’难题,团队通过交叉学科思维,将它们逐一击破。
面对的问题越复杂,就越考验跨学科的思考能力。团队成员在面临技术难题时,从不摆烂,从不应付交差,一个方案受挫,团队集智攻关,敢于突破,大胆创新、反复测试,在不断地挫折和失败中汲取经验。最终,历时八年,团队成功研制出了“全球首个数据智能驱动的全流程机器化学家平台”。
面对庞大的化学空间,配方和工艺的搜索常常止步于局部最优,无法进行全局探索。以潜力巨大的高熵化合物催化剂为例,获得其最优配方需要遍历测试极其庞大的化学配比组合,导致基于传统试错范式开发新材料异常艰难。机器化学家发挥其数据驱动和智能优化的优势,智能阅读16000篇论文并自主遴选出5种非贵金属元素,融合2万组理论计算数据和207组全流程机器实验数据,建立了理实交融的智能模型,指导贝叶斯优化程序从55万种可能的金属配比中找出最优的高熵催化剂。该平台实现了高熵材料的快速筛选与精准优化,创制出实用的高效催化剂,将实验遍历搜索所需的1400年缩短为5周,相比传统实验试错模式提效了5个数量级以上,以大数据与智能模型双驱动的化学品与新材料创制新范式,打破传统范式瓶颈。
机器化学家平台初步具备科学思维,在智能阅读文献、自主设计实验、自动执行合成-表征-测试的化学全流程、智能优化化学创制等方面全面超越欧美同类平台。该平台还建立了包含8千万化合物、1千万化学反应等资源的数据库和检索引擎,并在此基础上开发了物理化学知识图谱。目前,该平台正应用于析氧反应催化剂、掺氢氧化物光催化剂、新能源电池的高熵催化剂等新材料开发。
数据智能驱动的全流程“机器化学家”示意图
该平台研究成果论文已在最新一期《国家科学评论》学术期刊发表。国际审稿人评价说,该成果的“机器人系统、工作站和智能化学大脑都是最先进的”“将对化学科学产生巨大影响”。业内专家认为,机器化学家的研究工作脱离了传统试错研究范式的限制,展现出“最强化学大脑”指导的智能新范式的巨大优势,引领化学研究朝着化学理解数字化、操作指令化、创制模板化的未来趋势前进,确立了我国在智能化学创新领域的全球领跑地位。
面向国家以“科技强国”引领“现代化强国”的战略建设需求,团队瞄准世界科技前沿,向着科技创新高地奋进,坚定创新自信,锐意进取、勇攀科技高峰,继续服务“科技强国”战略,积极抢占科技竞争和未来发展制高点,进一步开展前沿关键技术研发,通过机器化学家平台全面探索了化学研究的未来发展趋势,不断推进数字化化学知识体系建设。加强技术与科学有机结合、国内相关团队深度合作,建立联盟,共同推广,形成定义新知识体系并自主解决科学难题的强化学智能,发展针对化学智能的符号语言与数据智能驱动的科学方法论。