李丽双,黄德根,陈春荣,等.基于支持向量机的中文文本中地名识别[J].,2007,(3):433-438 |
基于支持向量机的中文文本中地名识别 |
Identification of location names from Chinese texts based on support vector machine |
|
DOI:10.7511/dllgxb200703025 |
中文关键词: 支持向量机 中文文本 地名识别 机器学习 |
英文关键词: support vector machine Chinese texts identification of location names machine learning |
基金项目:国家自然科学基金资助项目(60373095; 60373096). |
|
摘要点击次数: 711 |
全文下载次数: 1022 |
中文摘要: |
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69% 和93.82%,F-值为90.12%. |
英文摘要: |
Based on the characteristics of location names in Chinese texts, a method of automatic identification of Chinese location names using support vector machine (SVM) is proposed. The character itself, character-based part of speech (POS) tag, the information |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|