便携式应急电源
镀铜焊丝的缺陷检测方法、装置、设...
电码的自动识别方法及存储介质
基于强化学习的楼栋摆放方法、装置...
用于观测水下生物的系统及其方法
一种电子设备的空中固件差分升级方...
一种印刷模切张力自动控制系统及其...
低功耗状态监控设备
一种利用RTP扩展头部解决视频帧...
一种高衍射效率相位型空间光调制器...
一种家装板材运输用包装机器人
航空发动机精密管路及其航空发动机...
宽光谱吸收的薄膜太阳能电池及光伏...
一种基于磁通压缩的脉冲磁体装置及...
一种总线访问仲裁装置及方法
一种处理网络抖动的方法及装置
基于光芯片的数据处理方法、装置、...
一种基于小基线条件下的大畸变广角...
一种自动识别设备间网络拓扑结构的...
基于光芯片的数据处理方法、装置、...
企业介绍页面,左右侧内容分别复制到相应容器即可,起始结束位置代码已作标注
专利名称一种基于文本聚类的语义相似度分析方法
申请日2019-11-12
申请号/专利号CN201911100265.8
专利权人中国石油大学(华东)
申请人中国石油大学(华东)
发明人/设计人唐昱润;宫法明;马玉辉;司朋举;李昕
公告日2020-02-21
公告号CN110825877A
法律状态审中
专利类型发明
行业分类信息技术

摘要

本发明公开了一种基于文本聚类的语义相似度分析方法,该方法包含:以未处理的文本数据作为输入,对通过数据预处理的文本进行词频统计,并将词频统计信息作为先验知识加入文本聚类,提出后验判别准则,也可以将词频统计作为分类器再次基础上进行无监督的聚类方法提高文本聚类结果的准确性和时效性;对处理过的文本进行同义词消除歧义、在进行语义角色标注后,生成融合上下文特征的语义向量,采用结构、参数完全相同的两个LSTM处理文本序列,并加入结果的乘积和方差,放大文本的相同点和差异性,计算得到相似度分析的最终结果。本发明的方法能够应用于多种不同领域的文本相似度分析的实际场景中,可以很好地处理类型不同的文本数据。
  关于我们  | 帮助中心  |  服务清单  |  发展历程 |  网站地图  |  手机访问

Copyrights 2016-2020  

南京锐阳信息科技有限公司 版权所有

苏ICP备17027521号-1

地址: 南京市秦淮区永智路5号五号楼3层