材料基因工程专用数据库团队
材料基因工程专用数据库团队
【骨干成员】
宿彦京 北京科技大学教授,国家重点研发计划重点专项首席专家
白 洋 北京科技大学教授
钱 萍 北京科技大学教授
【研究背景】
数据库和大数据技术是“材料基因工程”三大支撑平台和关键技术之一,它支撑和服务于高通量计算和高通量实验的数据需求,同时通过高通量计算和高通量实验积累数据,与数据挖掘技术融合,服务于新材料设计。目前,材料数据与机器学习的融合已成为材料基因工程领域发展最快、最有前途的领域之一。本团队将建设材料基因工程数据库,研究支撑高通量计算的人工神经网络原子势函数计算方法和软件,开展材料数据机器学习算法和软件,以及应用技术研究。
【研究目标】
围绕材料基因工程的数据需求,建设支撑和服务于材料基因工程发展的专用数据库系统,建成材料基因工程专用数据库架构和硬件条件,形成具有相当数据规模的材料基因工程数据库。建立镶嵌机器学习算法的原子势函数库,发展基于晶格反演的势函数算法。针对材料设计的需求,研发材料机器学习算法和软件。利用研发的数据库和数据技术,以高温合金、高熵合金和铁电材料为对象,优化和提升材料的性能,揭示材料的构效关系,提高材料的研发效率。
【主要研究内容】
1. 材料基因工程专用数据库技术研发与数据库建设
2. 原子势函数的机器学习算法与势函数库
3. 材料机器学习算法及应用
【重要研究进展】
材料基因工程专用数据库系统
材料基因工程专用数据库支撑高通量计算和实验的数据需求,通过融合数据挖掘技术,发现新知识、新规律,服务于新材料的设计与研发。本项目的目标是:研发高通量计算和实验复杂异构数据自动采集和处理加工技术,通过集成和融合数据挖掘技术,建成材料基因工程专用数据库架构。
研发了基于无模式存储的材料数据库技术,满足复杂异构数据的灵活扩展和数据挖掘的需求,采用数据动态容器技术,突破多源异构材料数据汇交的难题,建成数据库/应用软件可扩展的一体化系统框架;研发了基于云计算模式的材料高通量第一性原理计算软件,实现批量作业的自动生成、计算结果的自动处理、解析和数据汇交,使我国拥有了具有自主知识产权的材料高通量第一原理计算软;集成了12种材料数据挖掘的常用算法,建设了融合数据库的材料数据挖掘计算网络平台,实现特征变量的自动填充、机器学习模型的网络共享;研发了高通量材料x射线衍射和图像处理的技术和软件,实现了材料典型实验数据的自动采集与处理加工和入库。通过上述系统的集成,初步建成了材料基因工程专用数据库系统(www.MGEdata.cn)。
基于机器学习的高性能高熵合金设计
针对Al-Co-Cr-Cu-Fe-Ni六元高熵合金开展研究,提出了一种结合机器学习、实验设计与反馈的高熵合金优化设计技术,利用全局优化方法在复杂成分空间内进行优化合金筛选,通过实验反馈迭代强化模型,最终实现了高硬度六元高熵合金成分的加速设计。通过机器学习算法建立了目标属性(硬度)与元素的化学成分、材料性能描述符等变量之间的映射关系;基于机器学习预测和相关不确定性分析,利用效用函数预测新的实验候选成分,将所合成试样的测试数据增补进训练集数据,通过如此循环反馈,实现了目标属性的快速优化。在该六元高熵合金系统中,新炼制42种合金,找到35种硬度高于原训练集最高值的合金,其中17种合金的硬度比训练集最高值提高了10%以上。同时发现,将领域知识和化学成分共同作为描述符可以更快速地寻找到具有更优性能的材料。该机器学习算法还可以推广到大块非晶和高温合金等多组分合金设计。
1.发表论文
序号 | 论文名称 | 发表刊物 | 发表 时间 | 收录类别 | 作者 |
1 | Experimental study on the diffusion of hydrogen along individual grain boundaries in nickel | ELECTROCHEMISTRY COMMUNICATIONS | 2018.07 | SCI | Z. X. Ma, X. L. Xiong, L. N. Zhang, Z. H. Zhang, Y. Yan, Y. J. Su |
2 | 超材料隐身理论应用于多物理场的研究进展 (特邀综述、封面文章) | 中国材料进展 | 2019.01 | 中文核心 | 李扬,刘传宝,周济,乔利杰,白洋 |