STEMMING EN ESPAí‘OL PARA DOCUMENTOS RECUPERADOS DE LA WEB

Contenido principal del artículo

Hugo Armando Ordoñez Eraso
Carlos Alberto Cobos Lozada

Resumen

La recuperación de información en internet, hoy en dí­a se ha convertido en una importante área de investigación, debido al crecimiento acelerado de las fuentes de información que en la web se encuentran. La investigación en este campo se ha centrado en crear mecanismos, métodos y herramientas como los algoritmos de stemming y los meta-buscadores, que optimizan la precisión en este tipo de tareas, mejorando así­ los resultados retornados al usuario que utiliza el sistema. En este artí­culo se presenta y describe a nivel general, los componentes de un algoritmo denominado Filtro Español, que permite realizar stemming a documentos escritos en español en un sistema de búsqueda
web. Este se diseña, con el fin de ampliar automáticamente la búsqueda a todas las variaciones morfológicas de las palabras digitadas por los usuarios en las consultas y el contenido de los documentos. Para validar la eficiencia del analizador, se realizó un cálculo de similitud entre los documentos, aplicando el método de n-gramas. La evaluación contempla la precisión del filtro donde los
resultados de la primera valoración son interesantes.

Descargas

La descarga de datos todavía no está disponible.

Detalles del artículo

Cómo citar
Eraso, H. A. O., & Lozada, C. A. C. (2014). STEMMING EN ESPAí‘OL PARA DOCUMENTOS RECUPERADOS DE LA WEB. Revista UNIMAR, 29(2). Recuperado a partir de http://editorial.umariana.edu.co/revistas/index.php/unimar/article/view/220
Sección
Artículos resultado de investigación
Biografía del autor/a

Afiliación

Docente Investigador, Facultad de Ingeniería, Universidad Mariana, San Juan de Pasto, Colombia

Carlos Alberto Cobos Lozada

Docente Investigador Titular, Departamento de Sistemas, Universidad del Cauca, Popayán, Colombia

Citas

Manning, C., Raghavan, P. & Schütze, H. (2008) An Introduction to Information Retrieval. Cambridge, England: Cambridge University Press.

Baeza-Yates, R., Castillo, C. & Keith, B. (2006) Web Searching.En: Encyclopedia of Language & Linguistics. Elsevier: Oxford.p. 527-538.

Rolleke, T., Tsikrika, T. & Kazai, G (2006) A general matrix framework for modelling Information Retrieval. Information Processing & Management Vol. 42, (1) 4-30.

Jardine & C.J.V. Rijsbergen. (2008) The Use of Hierarchic Clustering in Information Retrieval ... 193 - Usa: Pittsburgh.

Jansen, B. & Spink, A. (2006) How are we searching the World Wide Web? A comparison of nine search engine transaction logs. Information Processing & Management.

Carmona, J., Cervell, S., Màrquez, L., Martí, M., Padró, L.,
Placer, R., Rodríguez, H., Taulé M. & Turmo, J. (1998) An
Environment for Morphosyntactic Processing of Unrestricted Spanish text.