Journal CIM

Ing. Sistemas Computacionales

Extracción de frases clave utilizando patrones léxicos a partir de resúmenes de artículos científicos

Autores: Esther Maritza Gallegos Camacho, Yulia Ledeneva, René A. García Hernández, José Luis Tapia Fabela

Fecha: Octubre 2017

 

Abstract

 

El artículo presenta un método propuesto para la extracción automática de frases clave a partir de resúmenes de artículos científicos. Se implementa un método no supervisado que consiste en la identificación de los patrones léxicos que pueden existir al asignar frases clave de forma manual. Las pruebas se realizan sobre el corpus Inspec que consta de 1000 artículos científicos. Cada resumen pasa por un preprocesamiento, palabras vacías, lematización, posteriormente se construyen los conjuntos de datos para la generación de patrones léxicos, estos se convierten en patrones de búsqueda para las frases candidatas y por último se hace una selección. La evaluación de frases clave se realiza utilizando la herramienta Rouge la cual nos permite conocer las medidas de Precisión, Recuerdo y F-Medida. Las evaluaciones se aplican para frases de top-5, top-10, top-15 y top-20. Finalmente, se realiza una comparación con métodos destacados del estado del arte obteniendo para F-Medida un tercer lugar dentro de los métodos no supervisados y para la medida de precisión se obtiene el primer lugar en comparación con los métodos.

TecNM|IT Orizaba

 

Oriente 9 # 852

Col. Emiliano Zapata

C.P. 94320

Orizaba, Veracruz, México

 

Tel: 272 72 5 70 56

 

 

© 2020 Tecnológico Nacional de México

Join us on: