Npj Comput. Mater.: 拉伸的非负矩阵分解:洞悉热膨胀下的衍射信号

海归学者发起的公益学术平台

交流学术,偶尔风月

图片

在化学和材料科学研究中,通常需要通过X射线粉末衍射(PXRD)和原子对分布函数(PDF)数据来分析材料的成分和结构。这些数据记录了材料中原子的排列方式,其中PDF数据展示了原子间距离的概率分布,而XRD图谱则显示在倒易空间中,其衍射峰的位置和强度随着衍射角的变化而变化。假设我们对样品进行了PXRD和PDF测量,并随着温度变化来观察样品,同时样品因热膨胀而发生变化。在这种情况下,不同相的热膨胀系数可能不同,导致PXRD中的布拉格峰和PDF中的峰位置发生变化,测量数据产生沿自变量轴的拉伸现象。然而,传统的非负矩阵分解(NMF)受到固定成分假设的限制,难以有效模拟这种拉伸行为,这使得


图片

Fig.1 | The workflow of STRETCHEDNMF.


南开大学统计与数据科学学院的顾然副教授是最优化理论与方法方面的专家,并在PDF和PXRD数据分析领域拥有丰富的经验。他和哥伦比亚大学、石溪大学以及科罗拉多州立大学的应用数学家,材料学家和实验物理学家组成的交叉学科团队提出了一种拉伸的非负矩阵分解算法(stretchedNMF),通过引入一个拉伸因子矩阵来描述数据中各组成部分的拉伸尺度,从而在面对包含多个具有不同热膨胀性的成分时,该算法能够高效地从数据中提取出不同的化学成分。他们首先将stretchedNMF转化为一个函数优化问题,提出了离散化方法和优化算法,旨在剥离测量信号中由简单拉伸导致的可变性,仅保留反映物质本质特性的组成成分。另外,该研究还开发了一个增强版本的算法(sparse-stretchedNMF),针对来自晶体材料的粉末衍射数据进行优化,特别是在信号发生细微拉伸变化的情况下,利用信号的稀疏性进行精确的组分提取。该研究团队使用模拟数据和真实数据证明,在热膨胀引起的衍射数据情况下,stretchedNMF和sparse-stretchedNMF显著优于传统的NMF。

 

图片

Fig. 2 | Solutions on real PXRD data using conventional NMF, stretchedNMF, and sparse-stretchedNMF. The first row (a, b, and c) shows MgMn2O4 and the second row (d, e, and f) shows tYOCl. The blue curves are the diffraction patterns obtained for those phases by multi-phase Rietveld refinement and are used as the desired component signal. The red curves represent the extracted NMF components. Extracted signals done with conventional NMF (red curves in a and d), STRETCHEDNMF (red curves in b and e) and SPARSE-STRETCHEDNMF (redcurves in c and f).


该研究为从多相样品的温度相关测量中提取成分提供了一种有趣的可能性,即使这些成分在测量过程中没有发生化学变化。尽管当前研究聚焦于温度序列数据的衍射信号,但该算法的普适性意味着它可广泛应用于任何涉及信号变化主要由或近似由因变量拉伸引起的场景,展示了其广阔的应用前景。

 

图片

Fig. 3 | Weights comparison on real PXRD data. The component weights vs. temperature of the data for (a) MgMn2O4 and (b) tYOCl. The results obtained by a multi-phase Rietveld refinement can be considered as ground-truth and are shown as the dashed purple line. The conventional NMF (red line) cannot capture the temperature evolution of the chemical components. STRETCHEDNMF (green) does much better and SPARSE-STRETCHEDNMF (blue) yields almost exactly the Rietveld result.