产品展示 Categories
联系我们 contact us
- 联系人:
- 陆先生
- 手机:
- 15895595058
- 电话:
- 0512-58628685
- 地址:
- 张家港市南丰镇
本相似度计算方法-电动液压滚圆机弯管机张家港
添加时间:2019-06-21

采集
转载中国知网整理! http://www.15895595058.net .1用义原向量描述短文本短文本分类部分用义原向量来表示短文本。本文采用文献[14]提出了将文本根据义原系数分解为义原向量的方法,并结合文献[15]的概念排歧方法。系统设计如图1所示。图1文本分解为义原向量流程图特征抽取和模型训练为了得到一篇短文本属于各个分类的概率并保持较高的计算效率,本文选择朴素贝叶斯分类器来为实体描述短文本分类。研究将每个实体的描述短文本按4.1的方法整理为义原向量。考虑到非叶节点义原的表意模糊,本文从义原向量中删除所有非叶节点义原。生成义原向量之后,本文需要在叶节点义原中抽取出n个适用于分类的义原作为分类特征。文献[16]提出了四种特征抽取方法:文档频率、信息增益、CHI统计和互信息。本文选择信息增益(IG)法、χ2统计量(CHI)法和互信息(MI)法作为特征选择的方法。当一个义原的信息增益、CHI值和互信息均大于特定阈值时,这个义原作为表达文本的特征。本文将每个文本表示为一个n维特征向量,X={x1,x2,…,xn},其中xi表示文本中对应义原的出现次数,以九类电影简介信息生成的特征向量作为训练集,建立朴素贝叶斯分类模型。4.3相似度计算本文通过朴素贝叶斯分类模型,计算两篇短文本属于每一个类别ci的后验概率P(ci|X),并将其整理为向量?本相似度计算方法-电动液压滚圆机弯管机张家港电动液压弯管机数控弯管机本文由弯管机张家港弯管机价格网站
采集
转载中国知网整理! http://www.15895595058.net