CARTOGRAFIADO DE DATOS. La Imagen de los datos permite brindar una representación de toda la estructura de la información en un sólo gráfico, aunque estos datos sean numéricos, alfanuméricos o textuales, precisos o imprecisos. Además permite, visualizar las relaciones multidimensionales que puedan existir entre ellos, permitiendo brindar un diagnóstico por imagen, una rápida y completa comunicación e interpretación de la información contenida en los datos.

miércoles, 2 de abril de 2008

Descripción de Trabajos de Postgrado

Nivel de Significación Estadística para el Aprendizaje de una Red Bayesiana
Una red bayesiana una vez construida constituye un dispositivo potente para el razonamiento probabilístico. Sin embargo nos queda la tarea de construcción de tal modelo. Un aspecto importante en el aprendizaje es medir la calidad no de cómo fue estructurada la red a partir de los datos, sino de con qué se determina esta estructura; es decir evaluar la significación estadística de los datos de entrenamiento independientemente del tipo o estructura de la red bayesiana. Esto permitirá mejorar el proceso de inferencia, simplificándolo, tomando relaciones que son realmente significativas. En este trabajo, se propone una métrica estadística que permita por un lado validar los datos con que se arma la estructura del grafo independientemente del tipo de red; por otro lado, validar las hipótesis que se infieren sobre una red bayesiana (relaciones de dependencia e independencia). Concretamente buscar un valor de prueba que determina la significación estadística de las relaciones representadas en la red. De este modo si utilizamos la red para clasificación, podremos validar estadísticamente el modelo de predicción, y en caso de que utilicemos la red para abducir nuevo conocimiento, validarlo estadísticamente al mismo (hipótesis). La propuesta es complementar los métodos bayesianos con las técnicas de descripción de la estadística clásicas.
Métodos de adquisición de conocimiento y modelado de sistemas expertos bayesianos de ayuda a la toma de decisiones
El objetivo en este trabajo es proponer métodos de ayuda a la adquisición de conocimiento para modelizar sistemas expertos de apoyo a la toma de decisión. La integración de técnicas para construir el modelo de conocimiento, basado en el descubrimiento de conocimiento y la modelización del mismo en forma de grafo (red de decisión) a partir del comportamiento observable y de las acciones de un profesional experto decisor. Los métodos multivariados (discretización óptima, análisis factorial y clasificación automática) permiten descubrir conocimiento de grandes conjuntos de datos a través del diagnóstico por imagen de datos; y las redes probabilísticas permiten definir en forma gráfica las relaciones de dependencia entre las variables y definir la función de probabilidad conjunta. Los diagramas de influencia han demostrado ser una herramienta eficaz para modelizar y tratar el conocimiento relativo a un problema de toma de decisiones .La importancia del presente trabajo y su mayor aporte, es que propone una investigación y el desarrollo de un marco metodológico generalizable a la resolución de problemas haciendo accesible a los profesionales instrumentos de análisis modernos de datos para descubrir conocimiento.
Cartografiado de Textos. Protocolo de Exploración y Visualización de datos textuales aplicados a la Minería de Textos
El análisis clásico de datos textuales no es económico y consume muchos recursos en especialistas y tiempo. Esta situación ha motivado el desarrollo de nuevas estrategias metodológicas con técnicas y paradigmas existentes, y la integración de los métodos de análisis que faciliten el proceso de exploración de datos textuales. A lo largo del tiempo distintos métodos han surgido con el objeto de explotar la información de tipo textual. Algunos como la ordenación alfabética, las ediciones de concordancias, índices y glosarios son muy antiguos. Otros mas recientes han aparecido gracias al desarrollo de técnicas estadísticas como el análisis de datos multivariado. Los métodos presentados en este trabajo facilitan la exploración, la gestión y la descripción de corpus de gran tamaño, permiten derivar información de ellos desde un punto de vista estadístico y poner de manifiesto sus rasgos estructurales. En objetivo de este trabajo es definir un marco teórico-metodológico que presente en forma sistemática la integración de las distintas técnicas estadísticas de análisis léxico y técnicas estadísticas de exploración multivariada; y utilizarlas en el trazado de un protocolo o guía para la exploración y diagnóstico por imagen de datos textuales. Además, experimentar con las estrategias metodológicas que implican la construcción del Cartografiado de Texto, a Casos de Ejemplo.

No hay comentarios: