电子技术资料下载
热搜关键词: 电路基础ADC数字信号处理封装库PLC
已收藏到:个人中心—我的下载—收藏
对基于MPN的相似重复记录识别算法的改进
相似重复记录识别是数据清理中的一个关键问题。文章针对常用的多趟邻接排序法提出了两点改进:一是在多趟排序识别过程中直接合并有重叠的相似记录集,取消了最后计算传递闭包的环节;二是利用关键字按字典序排序的特性,在求编辑距离之前先过滤前面的公共子串,减少了相似记录比较的开销。文章最后给出了改进算法与原算法的对比试验结果。
猜您喜欢
上传资源
TI 文字链专区
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
热门文章
热门标签
TI 技术论坛
TI 在线培训
Qorvo 射频技术研习社
请先登录EEWorld账户再进行下载哦
新注册用户赠送5积分
您已成功下载!
大家都在看
评论