• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
成果搜索

author:

陈晓玲 (陈晓玲.) [1] | 唐丽玉 (唐丽玉.) [2] | 胡颖 (胡颖.) [3] | 江锋 (江锋.) [4] | 彭巍 (彭巍.) [5] | 冯先超 (冯先超.) [6]

Indexed by:

PKU CSCD

Abstract:

园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持.植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节.针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建.针对现有Word2vec、ELMo和BERT等语言模型存在无法解决多义词、融合上下文能力差、运行速度慢等缺点,提出了嵌入ALBERT(A Lite BERT)预训练语言模型的实体识别和关系抽取模型.ALBERT预训练的动态词向量能够有效地表示文本特征,将其分别输入到BiGRU-CRF命名实体识别模型和BiGRU-Attention关系抽取模型中进行训练,进一步提升实体识别和关系抽取的效果.在园林植物语料库上进行方法的有效性验证,结果表明ALBERT-BiGRU-CRF命名实体识别模型的F1值为0.9517,ALBERT-BiGRU-Attention关系抽取模型的F1值为0.9161,相较于经典的语言模型(如Word2vec、ELMo和BERT等)性能有较为显著的提升.因此基于ALBERT模型的实体与关系抽取任务能有效提高识别分类效果,可将其应用于植物描述文本的实体关系抽取任务中,为园林植物知识图谱自动构建提供方法.

Keyword:

ALBERT 信息抽取 关系抽取 园林植物 实体识别 知识图谱 词向量 语料库

Community:

  • [ 1 ] [陈晓玲]福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;福州大学地理空间信息技术国家地方联合工程研究中心,福州350108
  • [ 2 ] [唐丽玉]福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;福州大学地理空间信息技术国家地方联合工程研究中心,福州350108
  • [ 3 ] [胡颖]福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;福州大学地理空间信息技术国家地方联合工程研究中心,福州350108
  • [ 4 ] [江锋]福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;福州大学地理空间信息技术国家地方联合工程研究中心,福州350108
  • [ 5 ] [彭巍]福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;福州大学地理空间信息技术国家地方联合工程研究中心,福州350108
  • [ 6 ] [冯先超]福州大学空间数据挖掘与信息共享教育部重点实验室,福州350108;福州大学地理空间信息技术国家地方联合工程研究中心,福州350108

Reprint 's Address:

Email:

Show more details

Related Keywords:

Source :

地球信息科学学报

ISSN: 1560-8999

Year: 2021

Issue: 7

Volume: 23

Page: 1208-1220

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 4

Affiliated Colleges:

Online/Total:279/10086985
Address:FZU Library(No.2 Xuyuan Road, Fuzhou, Fujian, PRC Post Code:350116) Contact Us:0591-22865326
Copyright:FZU Library Technical Support:Beijing Aegean Software Co., Ltd. 闽ICP备05005463号-1