Modelo de representación de textos basado en grafo para la minería de texto.
- Cuba : Instituto de Información Científica y Tecnológica, 2015.
- Trimestral
- Vol. 46, no. 1 (ene. / abr., 2015), p. 63-71
Periodicidad: Trimestral Se puede consultar de manera referencial en la página oficial de la revista: http://cinfo.idict.cu/index.php/cinfo/article/view/675 El link es de la página Redalyc (Red de Revistas Científicas de América Latina, el Caribe, España y Portugal). (La fecha de publicación del artículo no necesariamente coincide con la página de la que se recopilan los datos).
Revista
La Minería de Texto constituye el proceso de descubrimiento de conocimiento, previamente desconocido y potencialmente útil, mediante la extracción automática de información desde diferentes recursos escritos. La estructuración del contenido textual en modelos de representación intermedia constituye un aspecto clave en este proceso. En el trabajo se propone un nuevo modelo de representación basado en grafos para la estructuración de contenidos textuales y un método para su construcción automática. El modelo está basado en la representación de frases conceptuales y las relaciones entre ellas, a partir de análisis de proximidad en el texto, para lo cual fueron definidas varias medidas de distancia. En el método propuesto se combinan técnicas de procesamiento de lenguaje natural, con patrones léxicos y recursos de conocimiento para extraer los conceptos, y fueron definidos dos métodos para identificar las relaciones: distancia más cercana y ventana contextual. Se concibió en tres fases fundamentales: pre-procesamiento, extracción de información, y refinado, y se evaluó experimentalmente con noticias de una colección de referencia. Los experimentos se orientaron a evaluar la cantidad de información contenida en los grafos resultantes, así como la precisión en la extracción automática de conceptos, en los cuales se obtuvieron resultados prometedores.
1606-4925
= Ciencias de la Información.
Revistas de Bibliotecología Sistemas de almacenamiento y recuperación de información Procesamiento de lenguaje natural (Computación)