• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

魏晶晶 (魏晶晶.) [1] | 廖祥文 (廖祥文.) [2] (Scholars:廖祥文) | 陈巧灵 (陈巧灵.) [3] | 马飞翔 (马飞翔.) [4] | 陈国龙 (陈国龙.) [5] (Scholars:陈国龙)

Indexed by:

CQVIP PKU CSCD

Abstract:

属性抽取可分为对齐和语义标注两个过程,现有对齐方法中部分含有相同标签不同语义的属性会错分到同一个组,而且为了提高语义标注的精度,通常需要大量的人工标注训练集.为此,文中提出结合主动学习的多记录网页属性抽取方法.针对属性错分问题,引入属性的浅层语义,减少相同标签语义不一致的影响.在语义标注阶段,基于网页的文本、视觉和全局特征,采用基于主动学习的SVM分类方法获得带有语义的结构化数据.同时在主动学习的策略选择方面,通过引入样本整体信息,构建基于不确定性度量的策略,选择语义分类预测不准的样本进行标注.实验表明,在论坛、微博等多个数据集上,相比现有方法,文中方法抽取效果更好.

Keyword:

主动学习 属性抽取 语义分类

Community:

  • [ 1 ] 福州大学物理与信息工程学院
  • [ 2 ] 福建江夏学院电子信息科学学院
  • [ 3 ] 福州大学数学与计算机科学学院
  • [ 4 ] 福州大学福建省网络计算与智能信息处理重点实验室

Reprint 's Address:

Email:

Show more details

Version:

Related Keywords:

Related Article:

Source :

模式识别与人工智能

ISSN: 1003-6059

CN: 34-1089/TP

Year: 2016

Issue: 08

Volume: 29

Page: 673-681

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 4

Online/Total:51/9997584
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1