材料数据库技术团队
【骨干成员】
尹海清 北京科技大学教授
姜 雪 北京科技大学工程师
【研究背景】
材料科学数据是新材料研发和产业发展的重要条件基础,是国家科技创新发展和经济社会发展的重要基础性战略资源。材料数据库与材料计算模拟、材料实验表征一起,构成材料研究发展全流程三大基本工具,是加速新材料研发和应用进程的核心关键技术,对于国家安全、工程服役安全、智能制造等方面的重要性在数据时代日益彰显。建设材料基础研究与测试、服役数据的采集、存储、共享和智能应用机制,形成支撑材料科学研究、试验开发与工程应用的基础条件和数据体系,可整合碎片化的材料数据资源,提升原始创新能力,显著加速新材料的研发和应用进程。
【研究目标】
面向国家亟待解决的材料瓶颈及重大工程的材料核心问题的需求,旨在通过整合、汇聚材料数据资源,构建数据资源存储平台和材料信息学知识系统,实现数据驱动的材料创新设计,最大限度地发挥材料大数据在材料创新研究和生产中的突出作用。重点开展满足可靠性、科学性、完整性、可跟踪性和安全性等特点,以及材料设计、数据分析与机器学习需求的材料数据库的建设,包括材料基础数据库以及10-15种材料的专题数据库;研究并形成一系列全面覆盖材料数据库建设与应用的材料数据标准规范;建成一支稳定的数据库建设、维护更新的人才队伍,并逐步形成一套完整、可行的考核机制和激励机制;形成一至两门相关教学课程,培养具有材料数据整合与应用、数据挖掘与机器学习能力的人才,最终形成数据库建设与材料开发应用的可持续发展的材料数据生态系统。
【主要研究内容】
1. 材料基因工程基础及专题数据库
2. 材料信息学知识系统
3. 材料数据体系与标准规范
4. 数据驱动的材料设计与研发应用
【重要研究进展】
材料基因工程基础及专题数据库
基于国家材料科学数据共享网的长期数据整合与管理经验,收集了包含材料基础、金属材料、无机非金属等10余个材料专题数据库,形成了一系列全面覆盖材料数据库建设与应用的材料数据标准规范草案。采用人工阅读、像素点数值转化的方法,记录材料牌号与名称、材料成分、原材料信息、性能信息、实验条件等数据,从数据来源、数据审核人和数据误差率3个方面对数据质量进行控制和评价。同时,不断细化数据收集粒度与规范性,建立了包含730余个词条的“材料数据性能词典”,对性能同义词及英文符号进行映射。建立了材料数据知识产权保护机制,并形成了具有自主知识产权的材料数据唯一对象标识符注册软件。开展了数据驱动的材料设计与研发应用研究,构建了若干材料组织与性能预测模型,并成功用于指导高端棒线材、铝合金等企业生产过程。翻译了国内首部 “材料信息学”译著,并开设了《材料信息学》研究生课程。
材料数据性能词典示例 材料数据唯一对象标识符注册软件
材料信息学知识系统
开展了材料信息学知识系统探索性研究。建立材料信息学知识系统架构,由材料数据中产生的领域规则(知识),利用本体技术(RDF/OWL)对规则进行描述,可用于数据库系统的词条关联描述和数据推荐,弥补传统数据库建设与应用过程中领域知识的欠缺。
材料信息学知识系统架构 材料本体