(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111677903.X
(22)申请日 2021.12.31
(71)申请人 三峡大学
地址 443002 湖北省宜昌市西陵区大 学路8
号
(72)发明人 任顺 陆旻波 任东 安毅
杨信廷 王纪华
(74)专利代理 机构 宜昌市三峡专利事务所
42103
代理人 成钢
(51)Int.Cl.
G01N 23/223(2006.01)
G06F 30/20(2020.01)
G06F 17/18(2006.01)
G06F 111/06(2020.01)G06F 111/08(2020.01)
(54)发明名称
基于波长频次选择的土壤重金属光谱特征
提取、 优化方法
(57)摘要
本发明涉及基于波长频次选择的土壤重金
属光谱特征提取、 优化方法, 包括: 采集土壤样
品, 配置样本, 获取样本的光谱, 形成样本数据
集; 多次运行BOSS算法, 计算各变量被选中的概
率, 挑选出概率大的波长变量, 计算预测模型的
RMSECV平均值, 调整波长变量的数量使RMSECV平
均值最小, 确定波长变量的最优数量N; 重复运行
串联的ICO ‑BOSS算法进行波长变量选 择, 计算各
变量被选中的概率, 从中选出N个概率大的波长
变量, 计算预测模型的RMSECV平均值, 调整波长
变量的数量使RMSECV平均值最小, 得到最优波长
变量集; 利用得到的波长变量集预测重金属含
量。 本发明采用串联的ICO ‑BOSS算法, 并采用波
长频次选择策略, 选出最优波长变量集, 用于重
金属含量的预测, 提高了预测模 型的稳定性和精
度。
权利要求书2页 说明书9页 附图3页
CN 114354666 A
2022.04.15
CN 114354666 A
1.基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其特征在于, 利用串联的
区间组合优化算法ICO和引导软阈值算法BOSS, 即IC O‑BOSS算法, 作为光谱波长变量选择算
法, 采用波长频次选择策略, 重复运行波长变量选择算法, 计算各波长变量被选中的概率,
选出被选中概 率大的波长变量, 用于 土壤重金属含量的检测, 所述方法包括以下步骤:
步骤1: 采集土壤样品, 配置预定重金属浓度范围的土壤样本; 获取土壤样本的X射线荧
光光谱, 其中重金属元 素的含量 值利用化学 方法标定, 形成样本光谱数据集;
步骤2: 重复多次运行引导软阈值算法算法, 计算各波长变量被选中的概率, 挑选出被
选中概率大 的波长变量, 建立偏最小二乘法模型对重金属含量进行预测, 计算交互验证均
方根误差平均值, 增大或减小挑选的波长变量的数量, 直至交互验证均方根误差平均值最
小, 确定引导软阈值 算法算法挑选的波长变量的最优数量 N;
步骤3: 重 复运行串联的ICO ‑BOSS算法对光谱进行波长变量选择, 计算各波长变量被选
中的概率, 根据概率大小对波长变量进行排序, 从中选出N个波长变量, 对重金属含量进行
预测, 计算偏最小二乘法模型 的交互验证均方根误差平均值, 增大或减小挑选的波长变量
的数量, 直至交 互验证均方根 误差平均值 最小, 得到最优的预测重金属含量的波长变量;
步骤4: 获取待测土壤样品的光谱, 利用步骤3得到的波长变量对重金属含量进行 预测。
2.根据权利要求1所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其
特征在于, 所述区间组合优化 算法ICO, 包括以下步骤:
1)确定最优区间划分数量、 偏最小二乘法子模型的个数和子模型的比例,
将光谱划分为多个子区间, 并分别建立偏最小二乘法子模型预测重金属含量, 观察不
同数量的区间划分下的试验结果, 最小的均方根误差值对应的区间划分数量为最佳子区间
数量;
2)对波长区间进行组合优化;
2.1)偏最小二乘法子模型生成, 采用加权自举采样生成M个不同波长区间随机组合形
成的光谱子集, M表示采样次数, 每个波长变量的初始采样权重为1, 一次采样 中波长变量i
被选中的概 率pi的计算式如下:
式中n代表波长变量的数量, wi表示波长i的采样权 重;
2.2)采用偏最小二乘法和5折交互检验的方式计算每个波长区间组合子集对应的子模
型的交互验证均方根 误差值;
2.3)从全部波长区间组合中提取比例为α 的区间组合子集, 并计算出这部分区间组合
子集对应的子模型的交 互验证均方根 误差平均值, 记作RMSE CVm;
2.4)统计每个波长区间的波长变量在步骤2.3)确定的区间组合子集中出现的频次, 下
一轮迭代中第i个波长区间的采样权 重wi的计算式如下:
式中fi表示第i个波长区间的波长变量在提取的区间组合子集中出现的频次, kbest表示权 利 要 求 书 1/2 页
2
CN 114354666 A
2提取的区间组合子集包 含的波长区间的数量;
重复步骤2.1)至步骤2.4)形成迭代循环, 直到RMSECVm出现上升, 终止迭代, 执行步骤
2.5);
2.5)最后一次迭代中, RMSE CVm值最小的那一组波长区间作为 最终选中的波长区间。
3.根据权利要求2所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其
特征在于, 所述引导软阈值 算法BOSS, 具体包括:
S1: 在波长变量空间中采用自助随机采样方法生成子集, 在每个子集中提取波长变量,
并剔除重复波长变量, 对剔除后剩余的波长变量赋予相等的权 重;
S2: 对步骤S1得到的波长变量子集, 利用偏最小二乘法建立子模型, 计算子模型的交互
验证均方根 误差, 通过较小的交 互验证均方根 误差值提取最佳子模型;
S3: 计算子模型的回归系数, 对所有回归矢量进行归一化并求和, 得到新的波长变量的
权重;
式中Wi表示波长变量i的权重, K表示子模型数量, bi,k表示第k个子模型中变量i的归一
化回归系数绝对值;
S4: 基于得到的波长变量的权重, 应用加权自举采样方法生成新的子集, 在子集中提取
波长变量, 剔除重复变量并利用偏最小二乘法建立子模型, 将回归系 数绝对值较大 的变量
赋予较大的权重, 重复执行步骤S2、 S3、 S4, 直到得到的新子集的波长变量数量为1时停止,
迭代过程中将交 互验证均方根 误差最小的子集作为 最优波长变量 集。
4.根据权利要求3所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其
特征在于, 步骤2还包括利用模拟退火算法对引导软阈值算法的参数进 行寻优, 得到最优的
引导软阈值 算法参数, 具体包括:
步骤一: 对于每一种参数, 选择初始解x0, 令当前迭代解xi=x0, 将迭代步数l初始化l=
0, 当前迭代温度tl=t0, t0表示参数任意可 取的值;
步骤二: 如果在当前温度达到内循环停 止条件, 则执行步骤三; 否则, 从当前解xi的邻域
N(xi)中随机选择一个邻居xj, 计算Δfij=f(xj)‑f(xi), Δfij表示当前解xi与邻居xj作为参
数的预测模型 的交互验证均方根误差的差值, f(xj)、 f(xi)分别表示xi、 xj作为参数 的预测
模型的交互验证均方根误差值; 如果Δfij≤0, 则接受新解, 令xi=xj, 迭代次数l=l+1, 执
行步骤三, 否则计算exp( ‑Δfij/tk), 如果exp( ‑Δfij/tk)>random(0, 1), 则接受新解, 令xi
=xj, 迭代次数l =l+1, 否则重新选择邻居, 执 行步骤二;
步骤三: 判断是否达到迭代终止次数, 若是, 执行步骤四, 否则执行步骤二进行下一次
迭代;
步骤四: 判断预测模型的交互验证均 方根误差值是否达到设定的阈值, 如果是, 输出当
前解, 否则降低温度值并跳转至步骤二, 开始新 一轮迭代搜索, 直至满足 终止条件。
5.根据权利要求4所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其
特征在于, 步骤2得到的最优的引导软阈值算法参数包括: 迭代次数N=50, 采样次数K=
1500, 模型选取比率 δ =5%。权 利 要 求 书 2/2 页
3
CN 114354666 A
3
专利 基于波长频次选择的土壤重金属光谱特征提取、优化方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 22:23:09上传分享