SFA-MS: 基于快速傅里叶交叉相关和质谱信息的色谱谱峰校准算法
课题已结束,论文见于原文链接
色谱联用仪器是现代实验室常用的分析手段,它既可以对复杂体系进行高分离,又可以获得质谱独有的分子结构信息。在实际应用中,由于仪器漂移、流动相混合不均匀、固定相分解、使用过程中色谱柱变化及分析物之间反应等原因,不同样本的色谱峰之间会存在着保留时间漂移[1],这会使得最后的定性定量结果出现偏差。Zhang[2]等提出alignDE法,它利用微分进化算法(Differential evolution, DE)和多尺度色谱谱峰校准方法(Multiscale peak alignment, MSPA)来优化色谱峰的位置,以使得色谱谱峰得以校准。Gong[3]等人提出了一种结合三次样条插值和化学计量多元分辨较好地用来对中药色谱指纹图谱进行校正。但这些方法在处理精度要求较高的数据时,需要进一步优化,如遇到重叠峰问题,上述方法均无法得到很好地解决。
实际上,色谱联用仪器除了能够提供色谱分离数据之外,还可以提供各组分的质谱信息,若能充分利用这些信息,尤其是色谱对应的质谱信息,将会使色谱谱峰校准结果更加可靠。
近日,我们课题组提出一种新的更加精准的色谱谱峰校正方法,并将之称为SFA-MS (Chromatogram Alignment via SFA and Mass Spectra)算法,这种方法的校准结果更加精准,有效解决了重叠峰问题,且不会改变峰的形状。研究成果在线发表在Journal of Chromatography A,题为’Application of Subwindow Factor Analysis and Mass Spectral information for accurate alignment of non-targeted metabolic profiling’ [4]。其中,我的导师贺敏副教授为论文通讯作者,我为第一作者,湘潭大学硕士研究生燕攀为共同第一作者。

SFA-MS算法的主要优势在于充分利用质谱信息,采用子窗口因子分析法(SFA),在候选漂移点附近构建色谱窗口,并提取窗口里的质谱信息,然后进行特征值计算,以确定共有组分质谱信息的拟合程度,当待校峰和参考峰重叠且质谱信息一致使,则其对应的漂移点数就是最佳的漂移点

整体流程如图所示,
- 首先对模拟色谱数据进行预处理,其中红色为待校谱峰,黑色为参考谱峰,经过airPLS算法对色谱数据进行背景扣除,并釆用基于信噪比和Haar小波变换求导的方法来准确的确定谱峰位置和谱峰宽度,其结果如图(a)所示。
- 然后采用快速傅里叶交叉相关对两谱峰进行计算,可以得到一系列的候选漂移点数,如(b)所示,但仍需要结合质谱信息对各漂移点进行比对确定。
- 以谱峰1进行举例说明,峰1的候选移动点数为[5,8,-2],其中8为交叉相关系数局部最大数组中的最大值,然后应用子窗口因子分析法(SFA)进行特征值计算,以确定两谱峰共有组分质谱信息的拟合程度,当特征值越接近于1,则说明两谱峰间含有共有组分,其质谱信息拟合程度越相似,其特征值计算结果如图(c)所示,由图可以更清晰的看出当移动距离(Lag)为8时,特征值计算最接近于1,两谱峰质谱信息最相似。
- 经过对每个谱峰的峰顶和每个谱峰候选漂移点对应的质谱进行比对,可以充分确定色谱模拟数据的每个谱峰最佳漂移点是8,7和8,其比对结果如图(d)所示。
- 最后校后谱峰见于图(f)。

最后,我们选用代谢组学的鼻咽癌患者血清数据,用于测试SFA-MS算法在就校准代谢组学数据的效果,同时将校准前后的色谱数据绘于下图中,其中图(a)为图谱的原始数据,由图中局部放大图可以明显地看出各谱峰之间存在着明显的保留时间的漂移,经过SFA-MS算法校准后的结果示于图(b),校准后谱峰的形状未发生改变,对比校准前后的局部放大图可以清晰地看出所有色谱峰的保留时间得到了很好地校正。

我们结合小波变换(Haar小波),快速傅里叶交叉相关(FFT)、子窗口因子分析法(SFA)和质谱信息,提出了一种简单实用准确可靠的色谱校准SFA-MS算法。通过色谱模拟数据、代谢组学数据和LC/MS数据对其进行测试,SFA-MS具有精准、稳健和可靠等优点。并将其应用到“柴胡疏肝散”的定性分析研究中,结合GC/MS再解析,定性出11种半挥发性组分;通过与多种算法比较,可以看出SFA-MS对于色谱重叠严重和质谱非常相似的体系,亦能够得到很好的解析结果。由于SFA-MS算法结合子窗口因子分析法,充分利用质谱信息后再确定最佳谱峰漂移点,因而可以保证得到保证得到十分准确可靠的结果。
[1] T. S. J.M. Amigo, R. Bro, ChroMATHography: Solving Chromatographic Issues with Mathematical Models and Intuitive Graphics. 2010.
[2] Z. M. Zhang, S. Chen, Y. Z. Liang, Peak alignment using wavelet pattern matching and differential evolution [J]. Talanta, 2011,83: 1108-1117.
[3] F. Gong, Y.-Z. Liang, et al. Correction of retention time shifts for chromatographic fingerprints of herbal medicines [J]. Journal of Chromatography A, 2004, 1029(1-2): 173-183
[4]Yang, T., Yan, P., He, M., Hong, L., Pei, R., Zhang, Z.M., Yi, L.Z. and Yuan, X.Y. Application of Subwindow Factor Analysis and Mass Spectral information for accurate alignment of non-targeted metabolic profiling. J Chromatogr A, 2018, 1563, 162-170.