借鉴免疫的生物学机理,本文提出了一种基于抗体浓度的克隆选择算法,该算法中抗体的选择概率由亲和度与浓度共同决定,具有高亲和度和低浓度的抗体才受到促进。该算法在文本分类领域得到了成功应用。在文本分类的应用中,抗原、B 细胞和抗体分别对应训练文本、分类器的一个解和分类器的解与训练文本的亲和度,最后训练完成的分类器含有多个记忆细胞,有效保证了解的多样性。在数据集20_newsgroups[1]上的实验结果显示,该方法的综合性能指标F1 可达80.90%,优于Rocchio 法与Naïve Bayes 法。关键词文本分类,免疫,克隆选择,抗体浓度随着网络的快速发展,数字化文本也得到了爆炸性的增长,随之而来的问题就是如何管理和利用这些资源。通常,文本资源的管理都是建立在自动文本分类的基础上的。自动文本分类的任务是把未知类别的文本分到已知类别中,实现对文本的分类管理。文本分类涉及到人工智能、模式识别、机器学习、统计理论等学科,已经有很多方法成功应用到分类中,如朴素贝叶斯、K 近邻、Rocchio、决策树、支持向量机等[2]。本文基于免疫算法对文本分类进行研究,旨在针对大规模文本时提高分类性能。本文结构如下:第二节介绍相关的免疫概念及生物学机理,第三节介绍克隆选择算法并提出基于抗体浓度的克隆选择算法,第四节为其在文本分类中的应用,第五节给出实验结果,最后总结全文。
猜您喜欢
推荐内容
开源项目推荐 更多
热门活动
热门器件
用户搜过
随便看看
热门下载
热门文章
热门标签
评论