团体标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211107572.0 (22)申请日 2022.09.13 (71)申请人 福建新大陆软件工程有限公司 地址 350000 福建省福州市马尾区儒江西 路1号 (自贸试验区内) (72)发明人 焦洪林 朱坚 王雷 赵庆勇 (74)专利代理 机构 福州市鼓楼区京华专利事务 所(普通合伙) 35212 专利代理师 王美花 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/335(2019.01) G06F 16/35(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于用户画像协同分析的公文处理人 推荐方法 (57)摘要 本发明提供了文本推荐技术领域的一种基 于用户画 像协同分析的公文处理人推荐方法, 包 括如下步骤: 步骤S10、 采集大量的公文样本; 步 骤S20、 对采集的各所述公文样本进行预处理得 到公文数据集; 步骤S30、 基于所述公文数据集构 建公文处理人的用户画 像; 步骤S40、 基于所述用 户画像对公文处理人进行聚类得到聚类矩阵; 步 骤S50、 基于所述聚类矩阵构建公文推荐模型; 步 骤S60、 基于 F1值对所述公文推荐模型进行校验; 步骤S70、 利用校验后的所述公文推荐模型进行 公文处理人的推荐。 本发明的优点在于: 极大的 提升了公文推荐的准确率以及效率。 权利要求书2页 说明书9页 附图1页 CN 115510185 A 2022.12.23 CN 115510185 A 1.一种基于用户画像协同分析的公文处 理人推荐方法, 其特 征在于: 包括如下步骤: 步骤S10、 采集大量的公文样本; 步骤S20、 对 采集的各 所述公文样本进行 预处理得到公文数据集; 步骤S30、 基于所述公文数据集构建公文处 理人的用户画像; 步骤S40、 基于所述用户画像的相似度矩阵对公文处 理人进行聚类得到聚类矩阵; 步骤S50、 基于所述聚类矩阵构建公文推荐模型; 步骤S60、 基于F1值对所述公文推荐模型进行 校验; 步骤S70、 利用校验后的所述公文推荐模型进行公文处 理人的推荐。 2.如权利要求1所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S10具体为: 基于公文 文种维度、 发文时间维度以及部门维度采集大量的公文样本; 所述公文文种维度的公文文种至少包括部门发文、 部门收文、 业务单以及工单; 所述发 文时间维度的发文时间包括高峰时间段、 低估时间段以及平峰时间段, 并分别以3: 1: 1的比 例采集公文样本; 所述部门维度用于依据发文数量和收文数量设定各部分的采集权 重。 3.如权利要求1所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S20具体包括: 步骤S21、 对采集的各所述公文样本的噪声数据进行剔除; 所述噪声数据至少包括URL 地址、 特殊符号、 图片、 零宽 字符; 步骤S22、 将剔除噪声数据后的各 所述公文样本中包 含的繁体字转换为简体字; 步骤S23、 构建一包含若干个敏感词的词汇表, 基于所述词汇表对各公文样本中的敏感 词进行过滤; 步骤S24、 构建一包含若干个停用词的停用词库, 基于所述停用词库对各公文样本中的 停用词进行 过滤; 步骤S25、 对各所述公文样本进行词性标注, 保留词性为名词的公文样本构建公文数据 集。 4.如权利要求1所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S30具体包括: 步骤S31、 基于静态标签信息和动态标签信息构建用户画像的标签体系; 所述静态标签 信息至少包括性别、 年龄、 职 务以及所属部门; 所述动态标签信息包括负责领域以及办理习 惯; 所述负责领域包括下一环节处理人记录、 公文 具体内容; 所述办理习惯包括办理频率以 及办理时间; 步骤S32、 基于所述标签 体系以及公文数据集构建用户画像; 步骤S33、 对各所述用户画像进行多维相似度计算, 得到用户的相似度矩阵US。 5.如权利要求4所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S32具体为: 基于所述标签 体系构建用户画像为: P={Info, Keyword, Frequency, Time}; 其中, P表示用户画像; Info={Gender, Age, Post, Department}, Gender、 Age、 Post、 Department分别为性别、 年龄、 职务、 所属部门; Frequency表示办理频率; Time表示办理时权 利 要 求 书 1/2 页 2 CN 115510185 A 2间。 6.如权利要求4所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S40具体包括: 步骤S41、 设定初始用户类的集合C的容量为0、 待聚类的公文 处理人为集合U、 聚类个数 为m; 步骤S42、 判断集合U是否为空, 若否, 则基于所述相似度矩阵US获取最相似的一对用户 (ui, uj)以及对应的相似度值Max, 将所述相似度矩阵US对应位置设为0, 并进入步骤S43; 若 是, 则进入步骤S46; 步骤S43、 判断当前 是否为首次聚类, 若是, 则进入步骤S4 4; 若否, 则进入步骤S45; 步骤S44、 判断当前 聚类总数是否等于m, 若是, 则从所有已有聚类 中选取包含用户最少 的聚类进 行新用户添加, 并进入步骤S42; 若否, 则创建新类, 并将当前两位用户加入新创建 的类中, 从集 合U中删除对应的用户, 并进入步骤S45; 步骤S45、 遍历集合C中的类别ci, 若ui和uj有一个用户属于类别ci, 则直接将另一个用户 加入类别ci, 从集合U中删除对应的用户, 并进入步骤S42; 若ui和uj不属于集合C, 则进入步 骤S44; 步骤S46、 在集合C遍历完后, 判断当前 聚类总数是否等于m, 若是, 则基于各聚类得到聚 类矩阵CM; 若否, 则进入步骤S47; 步骤S47、 以聚类中包含的用户数递减排序, 遍历排序后的用户组进行组别分割, 并进 入步骤S46 。 7.如权利要求6所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S50中, 所述公文推荐模型用于执 行如下步骤: 步骤S51、 从所述聚类矩阵C M中筛选包含当前环 节的公文处 理人ui的用户组; 步骤S52、 基于所述ui所在的位置在用户组中向左搜索, 找出所有位于所述ui左边的用 户, 得到相似用户集 合; 步骤S53、 获取所述相似用户集合中各用户的偏好集合SU=(SU1, SU2,…, SUn); 其中, SUn 表示第n位相似用户的偏好公文集 合; 步骤S54、 利用所述聚类矩阵CM对偏好集合SU中的公文进行加权, 进而对相似度进行降 序排序: 步骤S55、 基于相似度的排序结果对公文处 理人的推荐结果进行召回。 8.如权利要求1所述的一种基于用户画像协同分析的公文处理人推荐方法, 其特征在 于: 所述步骤S60中, 所述F1值的计算公式如下: F1=(2*P*R)/(P+R); 其中, P表示精确率, P=TP/(TP+FN); R表示召回率, R=TP/(TP+FP); TP表示被模型预测 为正类的正样本; FN表示被模型 预测为负类的正样本; FP表示被模型 预测为正类的负 样本。权 利 要 求 书 2/2 页 3 CN 115510185 A 3
专利 一种基于用户画像协同分析的公文处理人推荐方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 02:11:26
上传分享
举报
下载
原文档
(472.8 KB)
分享
友情链接
GB-T 15852.2-2012 信息技术 安全技术 消息鉴别码 第2部分:采用专用杂凑函数的机制.pdf
NY-T 3926-2021 农作物品种试验规范 蔬菜.pdf
GB-T 33585-2017 复合磺酸钙基润滑脂.pdf
SY-T 0538-2021 管式加热炉规范.pdf
GB-T 14591-2016 水处理剂 聚合硫酸铁.pdf
DB11-T 1619-2019 空气压缩机节能监测 北京市.pdf
YD-T 4044-2022 基于人工智能的知识图谱构建技术要求.pdf
GB-T 38633-2020 信息技术 大数据 系统运维和管理功能要求.pdf
GB-T 7702.7-2023 煤质颗粒活性炭试验方法 第7部分:碘吸附值的测定.pdf
GB-T 41807-2022 信息安全技术 声纹识别数据安全要求.pdf
GB-T 14721-2010 林业资源分类与代码 森林类型.pdf
DB15-T 839—2022 高速公路养护工程预算编制办法及定额 内蒙古自治区.pdf
DB3212-T 1117—2022 政务数据安全风险评估规范 泰州市.pdf
GB-T 37124-2018 进入天然气长输管道的气体质量要求.pdf
GB-T 42595-2023 承压设备修理基本要求.pdf
DB14-T 2736—2023 池塘养殖尾水处理规范 山西省.pdf
GB 43068-2023 煤矿用跑车防护装置安全技术要求.pdf
GB-T 29070-2012 无损检测 工业计算机层析成像 CT 检测 通用要求.pdf
GB-T 30269.807-2018 信息技术 传感器网络 第807部分:测试:网络传输安全.pdf
火绒安全 2021终端安全情报年鉴.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(472.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。