(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211060601.2
(22)申请日 2022.08.31
(71)申请人 广州欢聚时代信息科技有限公司
地址 511442 广东省广州市番禺区南村镇
万博二路79 号万博商务区万达商业广
场北区B-1栋23层
(72)发明人 葛莉
(74)专利代理 机构 广州利能知识产权代理事务
所(普通合伙) 44673
专利代理师 王增鑫
(51)Int.Cl.
G06F 16/35(2019.01)
G06K 9/62(2022.01)
G06Q 30/02(2012.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
广告文本生成方法及其装置、 设备、 介质
(57)摘要
本申请涉及计算机技术领域中一种广告文
本生成方法及其装置、 设备、 介质, 所述方法包
括: 获取广告商品的商品标题及其参考广告文
本; 采用文本生成模型的编解码网络逐时间步解
码获得商品标题的解码特征信息, 确定其映射到
编解码网络所引用的第一参考词表的生成概率
分布; 采用文本生成模型的编码器获得商品标题
与其参考广告文本所构成的综合文本的编码特
征信息, 确定其相对于解码特征信息的关键特征
信息, 作为指针概率分布; 根据编码特征信息与
解码特征信息计算确定匹配权重, 以匹配权重对
生成概率分布和指针概率分布平滑加权, 获得优
化概率分布, 根据其在所述第一参考词表或所述
综合文本中取词确定目标广告文本的词元。 本申
请能够生成高质量的广告 文本。
权利要求书3页 说明书15页 附图6页
CN 115309905 A
2022.11.08
CN 115309905 A
1.一种广告 文本生成方法, 其特 征在于, 包括如下步骤:
获取广告 商品的商品标题及其 参考广告文本;
采用文本生成模型的编 解码网络逐时间步解码 获得所述商 品标题的解码特征信 息, 确
定所述解码特征信息映射到所述编解码网络所引用的第一 参考词表的生成概 率分布;
采用文本生成模型的编码器获得所述商品标题与其参考广告文本所构成的综合文本
的编码特征信息, 确定所述编码特征信息相对于所述解码特征信息的关键特征信息, 作为
指针概率分布;
根据所述编码特征信 息与所述解码特征信 息计算确定匹配权重, 以所述匹配权重对所
述生成概率分布和指针概率分布平滑加权, 获得优化概率分布, 所述优化概率分布包含映
射到所述第一 参考词表及所述综合文本中各个词元的概 率;
根据优化概率分布在所述第一参考词表或所述综合文本中取词确定目标广告文本的
词元。
2.根据权利要求1所述的广告文本生成方法, 其特征在于, 获取广告商品的商品标题及
其参考广告文本的步骤中, 包括如下步骤:
获取广告 商品的商品标题和商品图片;
采用文本编码器提取所述广告商 品的商品标题的深层语义信 息, 获得相应的文本编码
向量, 采用图像编码器提取所述广告商品的商品图片的深层语义信息, 获得相 应的图片编
码向量;
计算出所述广告商品的商品图片的图片编码向量与广告创意库中的各个创意广告中
的商品图片的图片编码向量之 间的第一相似度, 以及计算出所述广告商品的商品标题的文
本编码向量与广告创意库中的各个创意广告中的参考广告文本的文本编码向量之间的第
二相似度;
根据所述第一相似度和第二相似度从广告创意库中筛选出与所述商品标题相匹配的
参考广告文本。
3.根据权利要求1所述的广告文本生成方法, 其特征在于, 采用文本生成模型的编解码
网络逐时间步解码获得所述商品标题的解码特征信息, 确定所述解码特征信息映射到所述
编解码网络所引用的第一 参考词表的生成概 率分布, 包括如下步骤:
根据文本生成模型的编 解码网络所引用的第 一参考词表编码所述商 品标题, 获得第 一
编码向量;
采用所述编 解码网络的编码器提取出所述第 一编码向量的深层语义信 息, 获得相对应
的第一编码向量序列;
采用所述编 解码网络中的解码器以所述第 一编码向量序列作为输入, 获得相应的解码
特征序列作为解码特征信息, 逐时间步自回归解码所述解码特征信息得出各个时间步的生
成概率分布, 其中每 个生成概 率分布存 储映射到所述第一 参考词表中的各个词元的概 率。
4.根据权利要求1所述的广告文本生成方法, 其特征在于, 采用文本生成模型的编码器
获得所述商品标题与其参考广告文本所构成的综合文本的编码特征信息, 确定所述编 码特
征信息相对于所述解码特征信息的关键特征信息, 作为指针概率分布的步骤中, 包含如下
步骤:
拼接所述商品标题与其 参考广告文本构成 综合文本;权 利 要 求 书 1/3 页
2
CN 115309905 A
2根据文本生成模型的编码器所引用的第 二参考词表编码所述综合文本, 获得第 二编码
向量;
采用所述编码器提取出所述第 二编码向量的深层语义信 息, 获得相应的第 二编码向量
序列作为编码特 征信息;
将所述文本生成模型的编解码网络解码过程中每个时间步对应的所述解码特征信息
与所述编 码特征信息输入至注意力 层进行特征 交互, 获得相应的关键特征信息作为指 针概
率分布。
5.根据权利要求1所述的广告文本生成方法, 其特征在于, 根据 所述编码特征信 息与所
述解码特征信息计算确定匹配权重, 以所述匹配权重对所述生成概率分布和指 针概率分布
平滑加权, 获得优化 概率分布的步骤中, 包 含如下步骤:
以所述关键特征信 息对所述编码特征信 息进行加权求和, 获得所述综合文本的上下文
向量;
根据所述解码特征信 息与所述上下文向量计算确定匹配权重, 以所述匹配权重对所述
生成概率分布和指针概 率分布分别加权, 获得优化 概率分布。
6.根据权利要求1所述的广告文本生成方法, 其特征在于, 根据优化概率分布在所述第
一参考词表或所述综合文本中取词确定目标广告文本的词元, 包含: 根据优化概率分布, 采
用预设的采样策略在所述第一 参考词表或所述综合文本中取词确定目标广告 文本的词元。
7.根据权利要求1至6中任意一项所述的广告文本生成方法, 其特征在于, 所述文本生
成模型的训练过程, 包括如下步骤:
获取预备的训练集中的单个训练样本, 所述训练集中的各个训练样本包含商品的商品
标题及其参考广告文本, 各个训练样本相对应标注其商品在历史投放广告时使用的广告文
本作为监督标签;
采用文本生成模型的编解码网络逐时间步解码获得所述训练样本的商品标题的解码
特征信息, 确定所述解码特征信息映射到所述编解码网络所引用的第一参考词表的生成概
率分布;
采用文本生成模型的编码器获得所述训练样本的商品标题与其参考广告文本所构成
的综合文本的编码特征信息, 确定所述编 码特征信息相对于所述解码特征信息的关键特征
信息, 作为指针概 率分布;
根据所述编码特征信 息与所述解码特征信 息计算确定匹配权重, 以所述匹配权重对所
述生成概率分布和指针概率分布平滑加权, 获得优化概率分布, 根据优化概率分布在所述
第一参考词表或所述综合文本中取词确定目标广告文本的词 元, 构造出目标广告文本, 所
述优化概率分布包 含映射到所述第一 参考词表及所述综合文本中各个词元的概 率;
根据所述训练样本的监督标签确定所述目标广告文本的损失值, 在所述损失值未达到
预设阈值时对所述文本生成模型实施权重更新, 并继续调用其他训练样本实施迭代训练直
到模型收敛。
8.一种广告 文本生成装置, 其特 征在于, 包括:
数据获取模块, 用于获取广告 商品的商品标题及其 参考广告文本;
第一概率分布模块, 用于采用文本生成模型的编解码网络逐时间步解码 获得所述商品
标题的解码特征信息, 确定所述解码特征信息映射到所述编解码网络所引用的第一参考词权 利 要 求 书 2/3 页
3
CN 115309905 A
3
专利 广告文本生成方法及其装置、设备、介质
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 02:14:54上传分享