商务服务
论文笔记 | 通过DMCNN实现事件抽取
2024-11-01 23:42

本文主要复述论文["Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks"] 的主要内容,以便自我回顾,也希望可以给大噶带来帮助~

论文笔记 | 通过DMCNN实现事件抽取

传统ACE事件提取的方法主要依赖于精心设计的功能和复杂的自然语言处理(NLP)工具。这些传统方法缺乏泛化,需要大量人力,容易出现错误传播(error propagation)和数据稀疏性(data sparsity)问题。本文提出了一种新的事件提取方法,旨在自动提取词汇级(lexical-level)和句子级(sentence-level)功能,而无需使用复杂的NLP工具。我们引入了一个单词表示模型,用于语言的语义规范,并采用基于卷积神经网络(CNN)的框架来捕获句子级线索。然而,CNN只能捕获句子中最重要的信息,并且在考虑多事件句子时可能会遗漏有价值的事实。我们提出了一种动态多池卷积神经网络(DMCNN -- dynamic multi-pooling convolutional neural network),它根据事件触发器和参数使用动态多池层来保留更多关键信息。

目前事件抽取最先进的方法,是采用一组精心设计的特征,这些特征是由文本分析和语言知识提取的。通常分为两类:词法特征和上下文特征。
-词法特征
词法特征包括词性标签(part-of-speech tags)、实体信息、形态特征(例如,标记,引理等),其旨在捕获语义或单词的背景知识。由于这些预测语义背景的线索的有限性,以及单词独热编码(one-hot)带来的数据稀疏性问题,会导致无法充分捕获单词的语义。
-上下文特征
上下文特征,比如语法特征可以从依存关系中获取其参数和触发词的联系。我们称这种信息为句子级(sentence-level)线索。但是我们无法通过这类传统依存特征获取目标角色,此外,在特征学习中还有可能导致错误传播。
-卷积神经网络
论文中描述到,最近卷积神经网络(CNN)的改进已经被证明能够有效地捕获句子中的单词之间的句法和语义。CNN通常使用最大池化层,其对整个句子的表示应用最大操作以捕获最有用的信息。但是,在事件提取中,一个句子可能包含两个或多个事件,并且这些事件可能共享具有不同角色的参数。例如,S3(S3: In Baghdad, a cameraman died when an American tank fired on the Palestine Hotel. )中有两个事件,即Die事件和Attack事件。如果我们使用传统的最大汇集层并且只保留最重要的信息,那么我们可以获得描述“摄像师死亡”的信息,但是错过了关于“美国坦克的信息”的信息,这对预测攻击事件非常重要,对于将摄像师附加到红色是很有价值的。作为目标论点。在我们的实验中,我们发现这样的多事件句子占我们数据集的27.3%,而这个现象我们无法通知。

-Context-word feature (CWF):通过查找word embeddings而转换的每个单词标记的向量
-Position Feature(PF):表当前单词与预测的触发器或候选参数的相对距离。位置特征的每个距离值也由embedding vector表示,同时距离值也会随机初始化并通过反向传播进行优化。
-Event-type feature (EF):对触发分类阶段的预测进行事件类型编码,作为DMCNN亦或PF中的重要线索。

设定CWF的维度d=4、PF的d=1、EF=1,由其拼接成的词特征向量的长度d=dw+dp×2+de,得到输入矩阵X∈R(n×d),进入卷积层。
设定h个word大小的窗口,滤波器w ∈ R(h×d),通过运算(4)产生新特征ci,其中b∈R是偏置项,f是非线性函数,如双曲正切。 该滤波器应用于句子x1:h,x2:h+1,...,x(n-h+1):n中的每个可能的单词窗口,以产生特征映射ci,其中索引i的范围从1到n-h+1。
    以上就是本篇文章【论文笔记 | 通过DMCNN实现事件抽取】的全部内容了,欢迎阅览 ! 文章地址:http://motor168.cxdr.cn/news/221.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 珂云塔资讯移动 http://ch168.cxdr.cn/ , 查看更多   

最新新闻
四个技巧教会你抖音快涨速粉的方法
  随着抖音的爆发,有越来越多的人加入,如何从抖音中获得粉丝,以及如何快速获得抖音的粉丝?很多人做抖音时都会遇到这样的问
国庆旅游推荐-适合穷游的12个城市
  1、威海  花费:800-1000  游玩时间:2-3天  景点:火炬八街、猫头山、那香海、国际浴场、金石湾、布鲁斯海湾、半月湾、
好用的早教软件排行榜-2022宝宝早教app前十名
2022儿童早教app排行榜收录了最受家长欢迎的十款手机早教软件,这些早教app适用于0到8岁的孩子使用,可以很好的培养孩子的学习习
【海丝起点 · 逛逛厦门】跟团游人均1280元5天4晚美食海岛之旅!
  厦门,一座融合了海洋与文化的城市,拥有众多美丽的景点和美食。本文将为您揭秘一场人均1280元的5天4晚厦门之旅,带您逛遍集
安科瑞工业能源管控平台助力上海通用凯迪拉克优化能源结构挖掘节能潜力
安科瑞 汤婉茹/孟强荣1、系统概述安科瑞工业企业能源管理平台采用自动化、信息化技术和集中管理模式,对企业的生产、输配和消耗
1W字干货!手把手教你从0到1搭建企业知识管理系统
编辑导读:无序的知识多了,就会产生一种无序的“混沌状态”,这时候建立知识管理系统就非常重要。对于企业来说,建立知识管理系
seo工具,seo排名工具
【资源说明】1、开发环境:ssm框架;内含Mysql数据库;JSP技术2、项目代码都经过严格调试,代码没有任何bug!下载可以直接使用!
云+AI,火山引擎助力泛互联网行业创新和增长
5月15日,2024春季火山引擎 FORCE 原动力大会的泛互联网专场圆满落幕。本次分论坛聚焦“AI 和云驱动下的互联网新十年”主题,火
大学生的发疯文学是什么梗 大学生的发疯文学作品
大学生发疯文学出处大学生发疯文学,起源自微瑕这个梗,起初在微瑕中,第一句话都是港台风配音:TMD,出好吃懒做的室友,微瑕…
我们在体育课上打篮球 的翻译是:We play basketball on the physical education 中文翻译英文意思,翻译英语
  相关内容  awho stayed in the university just up the road from Mr. Jones’ house 谁在大学停留了路从先生。 琼斯’房
本企业新闻
推荐企业新闻