美尔贝申请动态生成长尾词的方法和系统专利,高效生成高质量长尾词列表
金融界2024年12月21日消息,国家知识产权局信息显示,成都美尔贝科技股份有限公司申请一项名为“一种动态生成长尾词的方法和系统”的专利,公开号 CN 119150855 A,申请日期为2024年8月。
专利摘要显示,本发明公开了一种动态生成长尾词的方法和系统,包括:S1、收集预设领域的搜索词以及该领域的相关文本数据,并对收集到的文本进行预处理;S2、构建历史全量词嵌入模型,构建单位时间内单个搜索词词嵌入模型;S3、对搜索词进行相似词匹配,组成相似词词根;S4、对上述S3生成的长尾词词根进行相似度校验,并根据校验结果,输出长尾词词根。本发明通过构建和训练适合特定应用领域的Word2Vec模型,可以高效生成高质量的长尾词列表。这种方法不仅能够降低人工成本,还能显著提高生成长尾词的动态性和相关性,更好地满足用户和系统的需求。
本文源自金融界
