中国民航大学陈达教授等:流判别神经网路驱动的奶粉真实性拉曼成像非定向检测方法

2023-10-17作者:来源:责任编辑:食品界 字体A+AA-

奶粉是婴幼儿群体日常饮食中的优质营养源,对于非母乳喂养婴幼儿群体,奶粉是其日常主要营养来源。因此,奶粉质量问题紧密关系着我国婴幼儿群体的健康成长。然而,随着奶粉市场日益发展,奶粉真实性问题层出不穷,奶粉真实性问题成为我国最受关注的食品安全问题之一。因此,开展全面高效的奶粉真实性检测刻不容缓。目前,传统奶粉真实性检测主要依赖于定向检测方法,然而,奶粉中潜在掺杂物种类繁多,导致传统定向检测需要联合大量方法,实际检测效率低。为应对非定向检测中存在的以上挑战,新型非定向数据分析技术的开发迫在眉睫。

天津大学精密仪器与光电子工程学院的夏启、何天伦和中国民航大学 天津市民航能源环境与绿色发展工程研究中心的陈达*等人提出了一种新型流判别神经网络(FDNN)驱动的奶粉真实性拉曼成像非定向检测方法。该方法采用卷积神经网络提取拉曼图像数据特征,利用分布转移策略将复杂的可信奶粉拉曼图像特征分布变换为简单的预设分布,并基于密度保持原理实现了样本可信概率的计算。结果表明,FDNN在不依赖掺杂物先验知识的前提下,准确识别了多种掺杂奶粉样本,其所得检测范围与检测精度优于传统非定向检测方法。该方法能够有效满足我国当前对奶粉真实性非定向检测的实际需求,也为其他非均匀食品体系的非定向检测提供一种新型手段。


1 样本分组

实验中将单掺杂奶粉样本和混合掺杂奶粉样本共1 170 个样本分为3组,分别为训练组、测试组和验证组,如图1所示。其中,训练组仅包含可信的正常样本,用于构建可信奶粉的特征分布区间,即非定向判别边界。测试组包含部分正常样本、三聚氰胺掺杂样本和淀粉掺杂样本,测试组不参与模型训练,仅用作在建模过程中指示模型的收敛程度。验证组包含与测试组不同的掺杂物,用于验证最终所得模型的泛化检测能力。



2 拉曼成像数据采集


实验中所采用的拉曼成像系统由拉曼光谱仪与二维位移平台构成。其中拉曼光谱仪扫描范围为200~2000 cm-1,光谱分辨率为2 cm-1,激发光波长为785 nm,激光功率为100 mW,二维位移平台位移精度为1 μm。在成像过程中,拉曼光谱仪采用背向散射采集方式,激发光通过二维位移平台中心开口聚焦于样品底部。对于每个样品,采样50 mm×50 mm区间内共2500个样本点的拉曼光谱信息,构成大小为50×50×1024的拉曼高光谱成像数据。


3 FDNN

奶粉真实性非定向检测的关键在于刻画奶粉特征可信分布区间,所得分布的边界为非定向判别边界。该边界内部仅包含可信样本,从而通过判断未知样本是否落入判别边界内部,即可识别掺杂奶粉样本。在此理论基础上,提出了一种FDNN用于构建非定向判别边界,FDNN方法的重点在于构建转移函数f,从而将,Pdata变换为简单分布Psim。该过程可通过数据驱动的方式实现。首先随机构造转移函数f,在此基础上,在训练样本集中不断采样得到样本x,通过转移函数f得到f(x),并计算在预设分布Psim下的Psimf(x))。通过最大似然估计法不断优化Psimf(x)),则可最终得到目标转移函数f。FDNN中转移函数要求具有双射可逆性。实验采用一种具有耦合结构的转移函数,如式(1)所示:

式中:x1x2为网络输入x的两部分;y1y2分别为网路输出y的两部分;st为两个独立的转移函数,该耦合层函数具有逆函数如式(2)所示,满足双射可逆性。



如图2所示,单层耦合层中,转移函数s和转移函数t均由两层一维卷积层构成,一维卷积层具有3个结构超参数,依次为输入通道数目、输出通道数目和卷积核大小。单层耦合层可对原始特征分布进行一定程度的变换,然而整体变换能力有限,其原因在于耦合层存在刚性变换部分。为了实现更复杂的分布变化,本研究将4层耦合层进行串联,并在每层耦合层之间交替改变刚性变化与耦合变换的顺序,最终构成如图3所示的FDNN。


如图3所示,FDNN将输入x平均分为x1x2,对x1进行刚性变换,对x2进行耦合变换。之后在第2层交换刚性变换与耦合变换顺序,对刚性特征进行耦合变换得到,对耦合特征进行刚性变换得到,以此类推,最终所得特征z1z2均经过两次耦合变换得到,网络具有复杂分布变换能力,满足构建复杂非定向判别模型的要求。


4 FDNN模型代价函数

FDNN模型旨在将复杂原始特征分布变换为已知的简单分布。采用的预设简单分布为标准正态分布,根据密度保持原理可知,FDNN模型的代价函数为式(3)所示,其计算结果为负对数似然(NLL),实际应用中,NLL值与样本可信度呈负相关关系。


式中:Jf为耦合层的雅可比矩阵,单层耦合层的雅可比矩阵如式(4)所示:



5 评价指标

将可信奶粉样本作为阴性样本,掺杂奶粉样本作为阳性样本,本实验采用3个评价指标对所得奶粉真实性检测模型进行评价,分别为假阳性率(FPR)、假阴性率(FNR)和整体准确率(AR)。在实际应用中,FPR对应误检率,FNR对应漏检率,因此,一个理想的非定向检测模型应该具有低FPR和低FNR,同时具有高AR。3个指标的计算方法如式(5)~(7)所示:

式中:NFN、NFP、NTN、NTP分别为假阴性、假阳性、真阴性、真阳性判别结果的个数。


6 FDNN模型训练

实验中,首先采用训练集对FDNN进行训练,并在训练过程中利用测试集测试FDNN的收敛程度。具体训练方法如下:从训练集中抽取样本,通过FDNN将所得样本映射到特征空间内,计算特征所得NLL值,并根据NLL梯度下降方向更新FDNN参数。将每遍历一次训练集作为一次训练迭代,每次训练迭代后,分别记录训练集(仅包含正常样本)所得平均NLL值、测试集正常样本所得平均NLL值和测试集掺杂样本所得平均NLL值,将以上结果绘制为收敛曲线对网络收敛过程进行可视化,如图4所示。


如图4所示,在训练初期,3个NLL值均保持相近的下降趋势,难以通过NLL值区分正常奶粉与掺杂奶粉,这是由于掺杂奶粉与正常奶粉的拉曼光谱具有一定的相似性,而初始化模型难以捕捉其中非显著的光谱差异。随着训练的进行,训练集正常样本NLL值逐渐下降,测试集正常样本NLL值与其保持同步下降,而测试集掺杂样本NLL值呈现逐渐上升趋势,正常样本NLL值与掺杂样本NLL值差异逐渐增大。该结果表明,通过FDNN映射后,正常样本集中分布于预设分布内部,与之相对,掺杂样本则逐渐偏移预设分布。最终在第20次迭代后,FDNN模型在测试集上的判别准确率达到100%,模型完成收敛。以上结果证明FDNN无需掺杂物先验知识即可高效地构建奶粉真实性非定向检测模型。


7 FDNN模型验证

为进一步验证所得模型对于奶粉中未知掺杂物的泛化适用性,采用验证集对训练所得FDNN模型进行验证,该验证集中包含了与训练集和测试集不同的正常奶粉样本与掺杂物。FDNN模型对验证集中不同样本所得NLL区间如图5所示。


如图5所示,对于验证集样本,FDNN模型所得的正常样本NLL区间较小,而掺杂样本NLL区间较大,且两种NLL区间重叠部分较小,证明FDNN对于验证集中的掺杂样本同样具有区分能力。将FDNN在训练集中所得最大NLL值作为判别阈值,如验证集样本所得NLL值大于判别阈值则判定为掺杂样本,反之判定为正常样本。采用以上方法检测验证集样本真实性,并记录所得检测准确率。同时,实验中对比了PCA与PCA-SVM非定向检测方法,这两种传统方法需要一定的掺杂物先验知识作为建模依据。因此,实验中选用三聚氰胺与淀粉掺杂样本作为特征选取依据,模型参数经过网格搜索调优得到。最终所得验证集中的14 种不同类型掺杂样本的检测准确率如表1所示。



如表1所示,FDNN模型对于验证集中14 种掺杂样本的检测准确率可达95.0%以上,平均准确率为97.3%,证明该方法对于不同掺杂样本具有良好的泛化能力。与之相比,两种基于PCA传统方法,对于其已知掺杂物(三聚氰胺和淀粉)的检测准确率较高,而对于未知掺杂物的检测准确率较差,检测范围受到先验知识的限制。此外,传统方法对于增量剂掺杂物的检测准确率较富氮类掺杂物更低,这是由于增量剂掺杂物拉曼光谱中通常具有较强荧光背景,其谱峰特征易被湮没,而PCA方法由于采用线性矩阵对原始光谱进行整体变换,因此难以捕捉局部的非显著形态特征。与之相对,FDNN采用卷积操作提取局部的光谱形态特征,对非显著光谱畸变的识别能力更强,因此相对传统方法检测可靠性更高。


如图6所示,FDNN方法的检测准确率在验证集掺杂量区间内较为稳定,几乎不受掺杂量的影响,具有稳健性。基于PCA的传统非定向检测模型随着掺杂量的降低,检测准确率下降明显。这是由于PCA方法通常仅挑选较少的特征作为判别依据,且所选特征与特定波数下光谱强度具有强相关,导致在掺杂量较低时,当光谱特征受到光谱噪声干扰或光强漂移时,检测结果会受到严重干扰。相对而言,FDNN采用卷积操作提取大量具有平移不变性的形态学特征,具备局部和整体特征提取能力,所构建的模型具有良好的抗干扰能力和稳健性。以上结果表明,FDNN模型具有良好的泛化适用性,且在检测范围和检测精度上相对传统方法具备突出的优势。


8 重现性实验结果


采用验证集对所得FDNN非定向检测方法进行连续7 d的重复性实验,每天评估并记录模型检测性能,结果如表2所示。在连续7 d的重复性实验中,FDNN方法均保持了较低的误判率和漏检率,同时具有较高的AR,证明本实验所提出的奶粉真实性非定向检测方法具有良好的可重复性。


结语

本实验针对奶粉真实性非定向检测的实际需求,发展了一种FDNN模型驱动的奶粉真实性拉曼成像非定向检测方法。该方法以卷积神经网络为基础,有机结合分布转移策略和密度保持原理,成功地在不依赖掺杂物先验知识的前提下构建可信奶粉的深层特征分布区间,从而高效地识别未知掺杂奶粉样本。该方法的训练过程仅需少量正常样本和较少迭代次数即可高效完成,所得模型对于多种未知掺杂奶粉样本的检测准确率达到97.3%,检出限达到0.3%,所得检测范围与检测精度相对传统方法具备优越性。结果表明,该方法在奶粉真实性检测应用中具有良好的应用前景,同时也为其他非均匀食品体系提供了一种可靠的新型非定向检测工具。



本文《流判别神经网路驱动的奶粉真实性 拉曼成像非定向检测方法》来源于《食品科学》2023年44卷第12期315-321页,作者:夏启,何天伦,黄志轩,陈达。DOI:10.7506/spkx1002-6630-20220530-364。