文章摘要
李丽双,黄德根,陈春荣,等.基于支持向量机的中文文本中地名识别[J].,2007,(3):433-438
基于支持向量机的中文文本中地名识别
Identification of location names from Chinese texts based on support vector machine
  
DOI:10.7511/dllgxb200703025
中文关键词: 支持向量机  中文文本  地名识别  机器学习
英文关键词: support vector machine  Chinese texts  identification of location names  machine learning
基金项目:国家自然科学基金资助项目(60373095; 60373096).
作者单位
李丽双,黄德根,陈春荣,等  
摘要点击次数: 711
全文下载次数: 1022
中文摘要:
      提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69% 和93.82%,F-值为90.12%.
英文摘要:
      Based on the characteristics of location names in Chinese texts, a method of automatic identification of Chinese location names using support vector machine (SVM) is proposed. The character itself, character-based part of speech (POS) tag, the information
查看全文   查看/发表评论  下载PDF阅读器
关闭