热搜关键词: MATLAB天线OpenCVVHDL

pdf

利用单词超团的二分图文本聚类算法

  • 1星
  • 2013-09-20
  • 363.99KB
  • 需要1积分
  • 0次下载
  • favicon收藏
  • rep举报
  • free评论
标签: 利用单词超团的二分图文本聚类算法

利用单词超团的二分图文本聚类算法

鉴于目前传统文本聚类方法中利用文档间的相似度进行聚类存在的问题,在传统的文本挖掘基础上提出了一种新的文本聚类算法——  利用单词超团的二分图文本聚类算法。该算法用文档中单词的关联模式来评估文档间的相似度及主题类别预测,并利用图划分策略来大大降低文档相似度比较算法的复杂度,同时将超团作为特征结构的扩展,可以在一定范围内减少语言信息的丢失,提高聚类效果。经实验证明该算法具有较高的有效性。关  键  词  二分图划分;  文本聚类;  单词超团Abstract  This  paper  proposes  a  new  algorithm  for  document-word  co-clustering.  After  mining  semantics  with  word  hyperclique  patterns,  the  document  dataset  with  a  bipartite  graph  is  described.  Then,  the  efficient  graph  partitioning  algorithm  is  employed  to  partition  this  graph,  so  that  the  high  computational  overhead  of  traditional  clustering  algorithms  over  huge  document  datasests  can  be  avoided.  During  clustering,  word  hyperclique  patterns  that  are  full  of  document  semantics  are  preserved.  In  this  way,  our  algorithm  partially  circumvents  the  problem  of  loosing  document  semantics,  which  happens  a  lot  in  traditional  clustering  algorithms  based  on  document  pairwise  similarity  alone.  Finally,  the  extensive  experimental  results  demonstrated  the  effectiveness  of  this  algorithm  in  document  clustering  accuracy  and  cluster  topic  detection.Key  words  bipartite  partition;  documents  clustering;  word  hyperclique

推荐帖子 最新更新时间:2022-08-11 08:20

VICOR DCM™ DC-DC 转换器模块相关评估板免费申请啦!
DCM™ DC-DC 转换器模块 支持所有标准行业输入电压的高功率转换器   DCM ChiP是一款隔离稳压DC-DC转换器,可在未稳压宽范围输入运行,以产生隔离输出。凭借其高频零电压开关(ZVS)拓扑结构,DCM转换器为其各种输入电压范围提供高效率。DCM模块转换器和下游负载点(PoL)产品支持高效配电,为一系列非稳压电源到负载点提供卓越的电源系统性能和连接性。DCM系
eric_wang 模拟电子
【转】Altera Design Software在linux安装指南
Altera Design Software This tutorial shows how to download, install, and configure the following software from Altera:Quartus II Subscription Edition v14.1USB-Blaster (I and II) Download Cable Driver
chenzhufly Altera SoC
设计射频电路板,这些技巧你得懂!
成功的RF设计必须仔细注意整个设计过程中每个步骤及每个细节,这意味着必须在设计开始阶段就要进行彻底的、仔细的规划,并对每个设计步骤的进展进行全面持续的评估。而这种细致的设计技巧正是国内大多数电子企业文化所欠缺的。 近几年来,由于蓝牙设备、无线局域网络(WLAN)设备,和移动电话的需求与成长,促使业者越来越关注RF电路设计的技巧。从过去到现在,RF电路板设计如同电磁干扰(EMI)问题一样,一直是工
大傻子哈哈哈 PCB设计
MSP-FET430UIF更新固件导致错误的通用恢复方法
不知道我的仿真器的版本有问题还是什么原因,当 IAR 5.5 提示升级固件后, 点选 YES, 弹出升级进度, 到一半的时候, 提示要求将 USB 连接 断开, 再 插上, 之后再点选 YES 继续, 当点选 YES 后, 仿真器的名字就不再是 "MSP-FET430UIF - VCP" ,而成了"TUSB3410 Device", 查询了N 多资料后才知道, 提示第二次插入 USB 后, 实际上
fish001 微控制器 MCU
[GD32E231 DIY大赛] 04. 机械臂艰难的组装过程
本帖最后由 传媒学子 于 2019-5-19 18:29 编辑 [GD32E231 DIY大赛] 04. 机械臂艰难的组装过程 夹杂这省钱和锻炼自己动手能力的动机下,我掏了160多大洋买了一个四自由度的小型机械臂组装散件,本来以为比较组装起来比较简单,但可能是我太幼稚了,如果知道组装这么费劲,还不如直接多掏30多,买个成品,这里还是奉劝大家如果时间不是很充裕的话,还是买个成品的机械臂。
传媒学子 GD32 MCU
迅为i.MX6ULL开发板IAR JLNK调试SDK程序
在1.2.2章节我们安装了SDK程序(安装位置:G:\nxp),在1.2.3章节我们安装了IAR开发工具,接下来我们打开IAR开发工具,如图 1所示 在本章节我们主要是讲解如何通过IAR+JLINK调试i.MX6ULL的IAR工程,关于IAR工具的具体使用,大家可以网上查找相关的文档。 然后我们点击“file->open->workspace”,如图 2所示: 然后会打开“Open
遥寄山川 ARM技术

评论

登录/注册

意见反馈

求资源

回顶部
查找数据手册?

EEWorld Datasheet 技术支持

热门活动

相关视频

可能感兴趣器件

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版 版权声明

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2022 EEWORLD.com.cn, Inc. All rights reserved
×