2025-05-30
“2025 浮梁美食荟” 盛大启幕 美食农文旅融合点燃消费新活力
2025-05-30
“2025 浮梁美食荟” 盛大启幕 美食农文旅融合点燃消费新活力
2025-05-30
SSCL CHINA 2025 & 上海国际物流节圆满落幕!6000+参会嘉宾,300+演讲嘉宾,100+展商
2025-05-30
SSCL CHINA 2025 & 上海国际物流节圆满落幕!6000+参会嘉宾,300+演讲嘉宾,100+展商
中国民航大学陈达教授等:流判别神经网路驱动的奶粉真实性拉曼成像非定向检测方法
2023-10-13作者:来源:责任编辑:食品界 字体A+AA-
奶粉是婴幼儿群体日常饮食中的优质营养源,对于非母乳喂养婴幼儿群体,奶粉是其日常主要营养来源。因此,奶粉质量问题紧密关系着我国婴幼儿群体的健康成长。然而,随着奶粉市场日益发展,奶粉真实性问题层出不穷,奶粉真实性问题成为我国最受关注的食品安全问题之一。因此,开展全面高效的奶粉真实性检测刻不容缓。目前,传统奶粉真实性检测主要依赖于定向检测方法,然而,奶粉中潜在掺杂物种类繁多,导致传统定向检测需要联合大量方法,实际检测效率低。为应对非定向检测中存在的以上挑战,新型非定向数据分析技术的开发迫在眉睫。
1 样本分组
实验中将单掺杂奶粉样本和混合掺杂奶粉样本共1 170 个样本分为3组,分别为训练组、测试组和验证组,如图1所示。其中,训练组仅包含可信的正常样本,用于构建可信奶粉的特征分布区间,即非定向判别边界。测试组包含部分正常样本、三聚氰胺掺杂样本和淀粉掺杂样本,测试组不参与模型训练,仅用作在建模过程中指示模型的收敛程度。验证组包含与测试组不同的掺杂物,用于验证最终所得模型的泛化检测能力。
2 拉曼成像数据采集
3 FDNN
奶粉真实性非定向检测的关键在于刻画奶粉特征可信分布区间,所得分布的边界为非定向判别边界。该边界内部仅包含可信样本,从而通过判断未知样本是否落入判别边界内部,即可识别掺杂奶粉样本。在此理论基础上,提出了一种FDNN用于构建非定向判别边界,FDNN方法的重点在于构建转移函数f,从而将,Pdata变换为简单分布Psim。该过程可通过数据驱动的方式实现。首先随机构造转移函数f,在此基础上,在训练样本集中不断采样得到样本x,通过转移函数f得到f(x),并计算在预设分布Psim下的Psim(f(x))。通过最大似然估计法不断优化Psim(f(x)),则可最终得到目标转移函数f。FDNN中转移函数要求具有双射可逆性。实验采用一种具有耦合结构的转移函数,如式(1)所示:
如图2所示,单层耦合层中,转移函数s和转移函数t均由两层一维卷积层构成,一维卷积层具有3个结构超参数,依次为输入通道数目、输出通道数目和卷积核大小。单层耦合层可对原始特征分布进行一定程度的变换,然而整体变换能力有限,其原因在于耦合层存在刚性变换部分。为了实现更复杂的分布变化,本研究将4层耦合层进行串联,并在每层耦合层之间交替改变刚性变化与耦合变换的顺序,最终构成如图3所示的FDNN。
如图3所示,FDNN将输入x平均分为x1和x2,对x1进行刚性变换,对x2进行耦合变换。之后在第2层交换刚性变换与耦合变换顺序,对刚性特征进行耦合变换得到
,对耦合特征
进行刚性变换得到
,以此类推,最终所得特征z1和z2均经过两次耦合变换得到,网络具有复杂分布变换能力,满足构建复杂非定向判别模型的要求。
4 FDNN模型代价函数
FDNN模型旨在将复杂原始特征分布变换为已知的简单分布。采用的预设简单分布为标准正态分布,根据密度保持原理可知,FDNN模型的代价函数为式(3)所示,其计算结果为负对数似然(NLL),实际应用中,NLL值与样本可信度呈负相关关系。
式中:Jf为耦合层的雅可比矩阵,单层耦合层的雅可比矩阵如式(4)所示:
5 评价指标
将可信奶粉样本作为阴性样本,掺杂奶粉样本作为阳性样本,本实验采用3个评价指标对所得奶粉真实性检测模型进行评价,分别为假阳性率(FPR)、假阴性率(FNR)和整体准确率(AR)。在实际应用中,FPR对应误检率,FNR对应漏检率,因此,一个理想的非定向检测模型应该具有低FPR和低FNR,同时具有高AR。3个指标的计算方法如式(5)~(7)所示:
式中:NFN、NFP、NTN、NTP分别为假阴性、假阳性、真阴性、真阳性判别结果的个数。
6 FDNN模型训练
实验中,首先采用训练集对FDNN进行训练,并在训练过程中利用测试集测试FDNN的收敛程度。具体训练方法如下:从训练集中抽取样本,通过FDNN将所得样本映射到特征空间内,计算特征所得NLL值,并根据NLL梯度下降方向更新FDNN参数。将每遍历一次训练集作为一次训练迭代,每次训练迭代后,分别记录训练集(仅包含正常样本)所得平均NLL值、测试集正常样本所得平均NLL值和测试集掺杂样本所得平均NLL值,将以上结果绘制为收敛曲线对网络收敛过程进行可视化,如图4所示。
如图4所示,在训练初期,3个NLL值均保持相近的下降趋势,难以通过NLL值区分正常奶粉与掺杂奶粉,这是由于掺杂奶粉与正常奶粉的拉曼光谱具有一定的相似性,而初始化模型难以捕捉其中非显著的光谱差异。随着训练的进行,训练集正常样本NLL值逐渐下降,测试集正常样本NLL值与其保持同步下降,而测试集掺杂样本NLL值呈现逐渐上升趋势,正常样本NLL值与掺杂样本NLL值差异逐渐增大。该结果表明,通过FDNN映射后,正常样本集中分布于预设分布内部,与之相对,掺杂样本则逐渐偏移预设分布。最终在第20次迭代后,FDNN模型在测试集上的判别准确率达到100%,模型完成收敛。以上结果证明FDNN无需掺杂物先验知识即可高效地构建奶粉真实性非定向检测模型。
7 FDNN模型验证
如表1所示,FDNN模型对于验证集中14 种掺杂样本的检测准确率可达95.0%以上,平均准确率为97.3%,证明该方法对于不同掺杂样本具有良好的泛化能力。与之相比,两种基于PCA传统方法,对于其已知掺杂物(三聚氰胺和淀粉)的检测准确率较高,而对于未知掺杂物的检测准确率较差,检测范围受到先验知识的限制。此外,传统方法对于增量剂掺杂物的检测准确率较富氮类掺杂物更低,这是由于增量剂掺杂物拉曼光谱中通常具有较强荧光背景,其谱峰特征易被湮没,而PCA方法由于采用线性矩阵对原始光谱进行整体变换,因此难以捕捉局部的非显著形态特征。与之相对,FDNN采用卷积操作提取局部的光谱形态特征,对非显著光谱畸变的识别能力更强,因此相对传统方法检测可靠性更高。
如图6所示,FDNN方法的检测准确率在验证集掺杂量区间内较为稳定,几乎不受掺杂量的影响,具有稳健性。基于PCA的传统非定向检测模型随着掺杂量的降低,检测准确率下降明显。这是由于PCA方法通常仅挑选较少的特征作为判别依据,且所选特征与特定波数下光谱强度具有强相关,导致在掺杂量较低时,当光谱特征受到光谱噪声干扰或光强漂移时,检测结果会受到严重干扰。相对而言,FDNN采用卷积操作提取大量具有平移不变性的形态学特征,具备局部和整体特征提取能力,所构建的模型具有良好的抗干扰能力和稳健性。以上结果表明,FDNN模型具有良好的泛化适用性,且在检测范围和检测精度上相对传统方法具备突出的优势。
8 重现性实验结果
采用验证集对所得FDNN非定向检测方法进行连续7 d的重复性实验,每天评估并记录模型检测性能,结果如表2所示。在连续7 d的重复性实验中,FDNN方法均保持了较低的误判率和漏检率,同时具有较高的AR,证明本实验所提出的奶粉真实性非定向检测方法具有良好的可重复性。
结语
本文《流判别神经网路驱动的奶粉真实性 拉曼成像非定向检测方法》来源于《食品科学》2023年44卷第12期315-321页,作者:夏启,何天伦,黄志轩,陈达。DOI:10.7506/spkx1002-6630-20220530-364。