Journal CIM

Ing. Sistemas Computacionales

Dos enfoques para extraer frases clave en publicaciones científicas

Autores: G. Flores-Petlacalco, M. Tovar-Vidal

Fecha: Octubre 2017

 

Abstract

 

Las frases clave capturan la idea central de un texto, por ello, su elección no es una tarea sencilla. Las frases clave se encuentran presentes en las publicaciones científicas, donde deben explicar de manera puntual la aportación que el autor desea presentar en el trabajo. Lamentablemente, su identificación es un proceso costoso por lo cual los investigadores en el área de Procesamiento de Lenguaje Natural han centrado sus esfuerzos en la creación de sistemas que realicen su extracción automática. En este documento, se describen dos sistemas para la extracción de frases clave en textos científicos. La primera propuesta usa la generación de n-gramas y posteriormente se realiza la discriminación de términos candidatos usando reglas empíricas. La segunda propuesta se basa en la construcción de patrones para la eliminación de frases candidatas. Además, se hace una comparación de estos sistemas con enfoques existentes que realizan la misma tarea, los resultados obtenidos se muestran en la evaluación.

TecNM|IT Orizaba

 

Oriente 9 # 852

Col. Emiliano Zapata

C.P. 94320

Orizaba, Veracruz, México

 

Tel: 272 72 5 70 56

 

 

© 2020 Tecnológico Nacional de México

Join us on: