检测及试验方法
实验材料
实验材料采用全国畜牧总站全国奶牛生产性能测定标准物质制备实验室配置的多种不同浓度的校准牛奶,样品成分浓度参考值由标准方法测定。按一定浓度比例选择90个样品来建模,30个样品用来预测。本实验主要是对牛奶样品中的蛋白质和脂肪两种成分进行定量测定,样品的主要成分浓度参考值分布如表1所示。
光谱采集
在采样之前,须将仪器预热1h以上,以保证仪器能稳定工作,为减小随机因素干扰,每个样品采集8次求平均值,为提高采集速度,采集波长间隔设为5nm,积分次数设为16,采集波段设为1000nm至2300nm,每采集一个样品需用时约50秒。采集水的光谱作为基线光谱,并在以后采集过程中自动扣除,每当仪器运行1h后重新设置基线,减小基线漂移带来的影响。将采集到的白板光谱作为背景光谱来进行吸光度的计算。其中某个牛奶样品的吸光度曲线如图2所示。
图1 近红外光谱仪系统 图2 牛奶样品吸光度曲线
表1 样品成分含量信息
成分 | *小值(g/dl) | *大值(g/dl) | 平均值(g/dl) |
蛋白质 | 2. 20 | 4. 16 | 3. 204 |
脂肪 | 2. 59 | 5. 68 | 3. 997 |
模型建立与优化
采集到的光谱信号往往还包括各种仪器噪声,如高频随机噪声、基线漂移、杂散光等,需要对光谱进行预处理以减弱其他非目标因素的影响,本文研究了多点平滑、傅里叶变换、小波变换三种预处理方式,在实际建模过程中根据不同的测量目标使用不同的预处理方式。建立预测模型时,数据量较大,需要对光谱数据进行降维,在此过程中若处理不当就会丢失重要光谱信息或出现共线问题,使回归模型不稳定,预测误差偏大,因此本文根据被测物分子结构的近红外特性,即牛奶中不同基团对应的近红外光谱吸收范围和强度不同,以及光谱图特点来进行特征值的提取,如提取光谱曲线的二次多项式拟合系数、平均值、*大值、*小值、差分值等,然后采用逐步回归,分析预测效果,找出影响因子*大的特征变量,减少预测方程维数。
在一般情况下,若建立的预测模型预测能力较强,样品预测残差应近似服从μ= 0的正态分布。Y变量残差F =Y ^ i-Yi中Yi表示第i个样品的参考值,Y ^i为第i个样品的光谱预测值。本课题研究中采用Y变量残差分布图来初步判断奇异点,剔除奇异点之后,重新优化预测模型。