团体标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111677903.X (22)申请日 2021.12.31 (71)申请人 三峡大学 地址 443002 湖北省宜昌市西陵区大 学路8 号 (72)发明人 任顺 陆旻波 任东 安毅  杨信廷 王纪华  (74)专利代理 机构 宜昌市三峡专利事务所 42103 代理人 成钢 (51)Int.Cl. G01N 23/223(2006.01) G06F 30/20(2020.01) G06F 17/18(2006.01) G06F 111/06(2020.01)G06F 111/08(2020.01) (54)发明名称 基于波长频次选择的土壤重金属光谱特征 提取、 优化方法 (57)摘要 本发明涉及基于波长频次选择的土壤重金 属光谱特征提取、 优化方法, 包括: 采集土壤样 品, 配置样本, 获取样本的光谱, 形成样本数据 集; 多次运行BOSS算法, 计算各变量被选中的概 率, 挑选出概率大的波长变量, 计算预测模型的 RMSECV平均值, 调整波长变量的数量使RMSECV平 均值最小, 确定波长变量的最优数量N; 重复运行 串联的ICO ‑BOSS算法进行波长变量选 择, 计算各 变量被选中的概率, 从中选出N个概率大的波长 变量, 计算预测模型的RMSECV平均值, 调整波长 变量的数量使RMSECV平均值最小, 得到最优波长 变量集; 利用得到的波长变量集预测重金属含 量。 本发明采用串联的ICO ‑BOSS算法, 并采用波 长频次选择策略, 选出最优波长变量集, 用于重 金属含量的预测, 提高了预测模 型的稳定性和精 度。 权利要求书2页 说明书9页 附图3页 CN 114354666 A 2022.04.15 CN 114354666 A 1.基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其特征在于, 利用串联的 区间组合优化算法ICO和引导软阈值算法BOSS, 即IC O‑BOSS算法, 作为光谱波长变量选择算 法, 采用波长频次选择策略, 重复运行波长变量选择算法, 计算各波长变量被选中的概率, 选出被选中概 率大的波长变量, 用于 土壤重金属含量的检测, 所述方法包括以下步骤: 步骤1: 采集土壤样品, 配置预定重金属浓度范围的土壤样本; 获取土壤样本的X射线荧 光光谱, 其中重金属元 素的含量 值利用化学 方法标定, 形成样本光谱数据集; 步骤2: 重复多次运行引导软阈值算法算法, 计算各波长变量被选中的概率, 挑选出被 选中概率大 的波长变量, 建立偏最小二乘法模型对重金属含量进行预测, 计算交互验证均 方根误差平均值, 增大或减小挑选的波长变量的数量, 直至交互验证均方根误差平均值最 小, 确定引导软阈值 算法算法挑选的波长变量的最优数量 N; 步骤3: 重 复运行串联的ICO ‑BOSS算法对光谱进行波长变量选择, 计算各波长变量被选 中的概率, 根据概率大小对波长变量进行排序, 从中选出N个波长变量, 对重金属含量进行 预测, 计算偏最小二乘法模型 的交互验证均方根误差平均值, 增大或减小挑选的波长变量 的数量, 直至交 互验证均方根 误差平均值 最小, 得到最优的预测重金属含量的波长变量; 步骤4: 获取待测土壤样品的光谱, 利用步骤3得到的波长变量对重金属含量进行 预测。 2.根据权利要求1所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其 特征在于, 所述区间组合优化 算法ICO, 包括以下步骤: 1)确定最优区间划分数量、 偏最小二乘法子模型的个数和子模型的比例, 将光谱划分为多个子区间, 并分别建立偏最小二乘法子模型预测重金属含量, 观察不 同数量的区间划分下的试验结果, 最小的均方根误差值对应的区间划分数量为最佳子区间 数量; 2)对波长区间进行组合优化; 2.1)偏最小二乘法子模型生成, 采用加权自举采样生成M个不同波长区间随机组合形 成的光谱子集, M表示采样次数, 每个波长变量的初始采样权重为1, 一次采样 中波长变量i 被选中的概 率pi的计算式如下: 式中n代表波长变量的数量, wi表示波长i的采样权 重; 2.2)采用偏最小二乘法和5折交互检验的方式计算每个波长区间组合子集对应的子模 型的交互验证均方根 误差值; 2.3)从全部波长区间组合中提取比例为α 的区间组合子集, 并计算出这部分区间组合 子集对应的子模型的交 互验证均方根 误差平均值, 记作RMSE CVm; 2.4)统计每个波长区间的波长变量在步骤2.3)确定的区间组合子集中出现的频次, 下 一轮迭代中第i个波长区间的采样权 重wi的计算式如下: 式中fi表示第i个波长区间的波长变量在提取的区间组合子集中出现的频次, kbest表示权 利 要 求 书 1/2 页 2 CN 114354666 A 2提取的区间组合子集包 含的波长区间的数量; 重复步骤2.1)至步骤2.4)形成迭代循环, 直到RMSECVm出现上升, 终止迭代, 执行步骤 2.5); 2.5)最后一次迭代中, RMSE CVm值最小的那一组波长区间作为 最终选中的波长区间。 3.根据权利要求2所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其 特征在于, 所述引导软阈值 算法BOSS, 具体包括: S1: 在波长变量空间中采用自助随机采样方法生成子集, 在每个子集中提取波长变量, 并剔除重复波长变量, 对剔除后剩余的波长变量赋予相等的权 重; S2: 对步骤S1得到的波长变量子集, 利用偏最小二乘法建立子模型, 计算子模型的交互 验证均方根 误差, 通过较小的交 互验证均方根 误差值提取最佳子模型; S3: 计算子模型的回归系数, 对所有回归矢量进行归一化并求和, 得到新的波长变量的 权重; 式中Wi表示波长变量i的权重, K表示子模型数量, bi,k表示第k个子模型中变量i的归一 化回归系数绝对值; S4: 基于得到的波长变量的权重, 应用加权自举采样方法生成新的子集, 在子集中提取 波长变量, 剔除重复变量并利用偏最小二乘法建立子模型, 将回归系 数绝对值较大 的变量 赋予较大的权重, 重复执行步骤S2、 S3、 S4, 直到得到的新子集的波长变量数量为1时停止, 迭代过程中将交 互验证均方根 误差最小的子集作为 最优波长变量 集。 4.根据权利要求3所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其 特征在于, 步骤2还包括利用模拟退火算法对引导软阈值算法的参数进 行寻优, 得到最优的 引导软阈值 算法参数, 具体包括: 步骤一: 对于每一种参数, 选择初始解x0, 令当前迭代解xi=x0, 将迭代步数l初始化l= 0, 当前迭代温度tl=t0, t0表示参数任意可 取的值; 步骤二: 如果在当前温度达到内循环停 止条件, 则执行步骤三; 否则, 从当前解xi的邻域 N(xi)中随机选择一个邻居xj, 计算Δfij=f(xj)‑f(xi), Δfij表示当前解xi与邻居xj作为参 数的预测模型 的交互验证均方根误差的差值, f(xj)、 f(xi)分别表示xi、 xj作为参数 的预测 模型的交互验证均方根误差值; 如果Δfij≤0, 则接受新解, 令xi=xj, 迭代次数l=l+1, 执 行步骤三, 否则计算exp( ‑Δfij/tk), 如果exp( ‑Δfij/tk)>random(0, 1), 则接受新解, 令xi =xj, 迭代次数l =l+1, 否则重新选择邻居, 执 行步骤二; 步骤三: 判断是否达到迭代终止次数, 若是, 执行步骤四, 否则执行步骤二进行下一次 迭代; 步骤四: 判断预测模型的交互验证均 方根误差值是否达到设定的阈值, 如果是, 输出当 前解, 否则降低温度值并跳转至步骤二, 开始新 一轮迭代搜索, 直至满足 终止条件。 5.根据权利要求4所述的基于波长频次选择的土壤重金属光谱特征提取、 优化方法, 其 特征在于, 步骤2得到的最优的引导软阈值算法参数包括: 迭代次数N=50, 采样次数K= 1500, 模型选取比率 δ =5%。权 利 要 求 书 2/2 页 3 CN 114354666 A 3

.PDF文档 专利 基于波长频次选择的土壤重金属光谱特征提取、优化方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于波长频次选择的土壤重金属光谱特征提取、优化方法 第 1 页 专利 基于波长频次选择的土壤重金属光谱特征提取、优化方法 第 2 页 专利 基于波长频次选择的土壤重金属光谱特征提取、优化方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 22:23:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。