该文提出了基于Web 的无指导译文消歧的词模型及N-gram 模型方法,并在尽可能相同的条件下进行了比较。两种方法均利用搜索引擎统计不同搜索片段在Web 上的Page Count 作为主要消歧信息。词模型定义了汉语词汇与英语词汇之间的双语词汇Web 相关度,根据汉语上下文词汇与英语译文之间的相关度进行消歧;N-gram模型首先假设不同语义下的多义词N-gram 序列行为模式不同,从而可对多义词不同语义类下词汇在实例中的N-gram 序列进行统计与分析以进行消歧。两个模型的性能均超过了在国际语义评测SemEval2007 的task#5 上可比较的最好无指导系统。对这两个模型进行试验对比可发现N-gram 模型性能优于词模型,也表明组合两类模型的结果有进一步提升消歧性能的潜力。
猜您喜欢
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
热门文章
热门标签
评论