Redes de conocimiento

Semio: la organización de información en mapas navegables

Equipo Enredando
29 julio, 2016
Página 3 de 3

 ¿Cómo funciona?

Semio Taxonomy combina una tecnología de análisis lingüístico y agrupación estadística, por una parte,  con los requisitos de vocabulario definidos por el usuario, por la otra, lo que permite crear una estructura instintivamente navegable de categorías que ofrece un acceso inteligente al espacio de información  global dentro  de un  agregado de texto previamente  desestructurado.

Las frases y palabras clave más significativas se extraen de una serie de fuentes de texto como páginas web de internet/intranet, Lotus Notes, Documentum, bases de datos ODBC, XML, etc. Este proceso combina la detección lingüística,  el análisis de proximidad  y las normas  de derivación y normalización para producir una tecnología de extracción de conceptos lo más clara e informativa  disponible.

A continuación, esos conceptos extraídos se agrupan mediante técnicas de la teoría de la información desarrolladas en  los últimos veinte años. Una vez este proceso ha seleccionado la información verdaderamente relevante del texto original desestructurado, se puede aplicar a cualquier estructura de clasificación del nivel superior. Estas estructuras extraen derivados léxicos de la red de clusters y las sitúan en categorías. El resultado es una estructura de categorías navegable que ayuda al usuario a conocer el espacio de búsqueda sin recurrir al método de «ir a la caza» de palabras clave. Dado que el requisito de una estructura de clasificación es que refleje la información que existe en el texto original, la configuración y personalización de la estructura es prácticamente ilimitada.

El usuario puede configurar sus taxonomías para reflejar un thesaurus corporativo o un vocabulario controlado. Semio Taxonomy es completamente adaptable al thesaurus ISO y puede personalizarse siguiendo cualquier iniciativa terminológica del usuario. La potencia que implica aplicar múltiples estructuras de clasificación a la misma fuente de texto se refleja cuando los usuarios ven por primera vez la prueba textual que ha creado estas estructuras en primera instancia.

 Fases  del proceso

 Semio Taxonomy ejecuta un proceso en tres fases para clasificar los contenidos de texto:

.- El texto se recoge  en las fuentes  de la Red,  como intranet,  internet, Lotus Notes,  Documentum,  etc.

.-Semio extrae frases informativas relevantes del texto. Las frases se vinculan a una serie de categorías que pueden derivarse de un thesaurus, el conjunto de categorías previamenle construido de Semio o una estructura personalizada elegida por el usuario. Las estructuras de categorías pueden ser luego validadas y modificadas mediante un proceso fácil e interactivo que garantiza su calidad y coherencia.

______________________________

[Se puede acceder al artículo completo en el libro de la I Jornada en.red.ando, en la página 74]

[Los artículos publicados hasta ahora, y que continuamos publicando en Coladepez, sobre las Tecnologías de la Información y el Conocimiento (TI y Conocimiento) se presentaron en la I Jornada en.red.ando, celebrada en Barcelona el 27 de octubre del 2000 y fueron elaborados por el equipo de contenidos de Enredando.com. Los textos están editados para ganar precisión con respecto al libro I Jornada en.red.ando. Sistemas de análisis, tratamiento y presentación de la información, que van a cambiar las organizaciones”, que se publicó después del evento, pero sin alterar el significado en ningún caso. LAFH ha añadido algunos comentarios entre corchetes para aclarar o enfatizar algunos aspectos de cada una de estas tecnologías, o de lo que se dijo en los debates. El libro se puede obtener gratis en el Badulaque de Coladepez. A partir de esta semana iniciamos un examen detallado de cada una de las tecnologías expuestas hasta ahora.]

print

Páginas: 1 2 3