pdf

优化初始值的K均值中文文本聚类

1星
2013-09-20
162.99KB
需要2积分
1次下载

文档简介
猜您喜欢
推荐下载
用户评论0

标签：优化初始值的K均值中文文本聚类

文本聚类是中文文本挖掘中的一种重要分析方法。K 均值聚类算法是目前最为常用的文本聚类算法之一。但此算法在处理高维、稀疏数据集等问题时存在一些不足，且对初始聚类中心敏感。本文针对这些不足，提出了用特征词向量空间模型来降低向量的维数；并提出一种新的优化初始聚类中心的算法，即根据文章的特征词选择有代表性的初始聚类中心。实验表明特征词向量空间模型和优化初始聚类中心的算法能降低计算复杂度，增强结果的稳定性，并产生质量较高的聚类结果。

展开预览

猜您喜欢

上传者

: crazyjackson; 查看他的其他资源

推荐内容

开源项目推荐更多

热门活动

热门器件

用户搜过

随便看看

热门下载

热门标签

厂商技术中心

TI 技术论坛

TI 在线培训

Qorvo 射频技术研习社

EEWorld订阅号

EEWorld服务号

汽车开发圈

机器人开发圈

EEWorld电子技术资料下载——分享有价值的资料

索引文件: 5 14 10 3 9

北京市海淀区中关村大街18号B座15层1530室电话:(010)82350740 邮编：100190

举报人：
被举报人：	crazyjackson
举报的资源分：	2
* 类型：
	请您提供公司营业执照和软件相关版权到service@eeworld.com.cn
* 详细原因：

优化初始值的K均值中文文本聚类

文档简介

评论