Monitor Tecnológico de Cómputo

julio/agosto 1995 vol 1, núm 3

Contenido:


Monitor es una publicación bimestral del Departamento de Cómputo del IIE.



Visualización Científica

La Visualizacion Científica es una rama de la Graficación por Computadora, y su objetivo es mostrar datos científicos mediante gráficas generadas por computadora, aprovechando la versatilidad y poderío de cálculo de las computadoras.

En Visualización Científica, la manera de visualizar los datos no está regida por técnicas o recetas, sino principalmente por la abstracción que el científico tiene de sus datos, estableciéndose como un proceso analítico, creativo y de exploración.

La Visualización Científica es una herramienta para la investigación, útil, creativa y apasionante. Un sueño hecho realidad, en donde el científico puede visualizar sus datos tal y como alguna vez los imaginó. ?Cuántos de nosotros no hemos soñado alguna vez con ver gajos de la Tierra, ponerle color al viento, convertir flujos en vectores, introducirnos en las llamas, "cortar" las nubes? Con Visualización Científica, lo invisible se hace visible: el sonido, el aire, el calor, el magnetismo al alcance de la vista.

El científico debe determinar los parámetros para ver sus datos: dimensiones, espacios, tiempos, colores, rangos, escalamientos, etc. Los elementos básicos con que cuenta son: puntos, líneas, superficies y colores, y algunos más complejos, particulares a cada visualización. Existen algunas técnicas y nomenclaturas propuestas para la Visualización Científica, sin embargo, nada impide al científico ver las cosas de la manera en que las quiere ver.

Desde el punto de vista técnico la Visualización Científica es un proceso demandante de recursos de cómputo (algo propio de la Graficación por Computadora, y aumentado por el procesamiento matemático de los datos), de manera que la Visualización Científica "flexible" solo está al alcance usando grandes equipos, equipo especializado o supercomputadoras.

La Visualización Científica se ha enriquecido enormemente con los avances logrados por la Graficación por Computadora y las Técnicas de Interacción, tales como: animación, dispositivos tridimensionales, rendering y actualmente la Realidad Virtual. No se puede dejar de reconocer el impulso proveniente de las aplicaciones comerciales (principalmente el cine) y militares.

Todo esto con la intención de ver, descubrir y entender cada vez más el mundo que nos rodea.

Otras imágenes: Imagen 1 Imagen 2 Imagen 3 Imagen 4 Imagen 5 Imagen 6

  • Siga esta liga para explorar los recursos sobre Visualización Científica en el Internet.

    Data Mining: Extracción de Conocimientos en Grandes Bases de Datos

    Data Mining es una técnica para buscar relaciones y patrones globales escondidos en grandes bases de datos, tales como relaciones entre los datos de los pacientes de algún hospital y su diagnóstico médico. Se define como "la extracción no trivial de información implícita, previamente no conocida y potencialmente útil a partir de datos".

    Data Mining utiliza la Lógica Inductiva. A diferencia de la Lógica Deductiva, en la que todos los resultados (deducciones) son lógicamente correctos, la Lógica Inductiva generaliza a partir de la base de datos. Extrae información de alto nivel, o conocimiento. El conocimiento que es extraído se almacena en forma de reglas. Por ejemplo, después de ver cien plantas, y notar que todas son de color verde, se puede inducir que todas las plantas en el mundo son de color verde:

    SI objeto = planta ENTONCES color-objeto = verde
    Aunque sea incorrecto, pues existe el caso de las algas rojas, la información nos es útil.

    El conocimiento puede ser empleado en el análisis de datos, aplicaciones de soporte de decisiones y sistemas de información ejecutiva, por ejemplo:

  • Predecir si alguien va a pagar un préstamo, en base a datos como su salario, escolaridad, número de automóviles que tiene y valor de su casa.
  • Un programa puede inducir que los envíos a una bodega nunca incluyen cierto producto, y notificar en el momento que suceda para corregir el error.

    Uno de los mayores problemas con Data Mining es que el número de posibles relaciones es demasiado grande, y se vuelve prácticamente imposible el validar cada una de ellas: antes de hallar la relación entre un diagnóstico de hepatitis con los hábitos alimenticios del paciente, se tuvo que buscar la relación con un sinnúmero de otros factores: tipo de sangre, edad, sexo, etc. Para resolver este problema, se utilizan estrategias de Búsqueda, traídas del área de Aprendizaje Maquinal.

    Otro problema es que la información muchas veces está corrompida, tiene ruido, o simplemente le faltan partes. Para esto, se aplican técnicas estadísticas que ayudan a estimar la confiabilidad de las relaciones halladas.

    Data Mining vs. Aprendizaje Maquinal

    A diferencia de Aprendizaje Maquinal, otra sub-área de la Inteligencia Artificial, Data Mining opera sobre grandes cantidades de datos. Además, la finalidad original del los datos no es la de ser utilizados para extraer conocimiento. Por lo tanto, los datos a procesarse pueden contener errores, ruido y hasta contradicciones.

    En un experimento clásico de Aprendizaje Maquinal, elaborado por Patrick Winston, se logró que una computadora se formara el concepto de "arco" a partir de ejemplos. Estos son cuidadosamente seleccionados y depurados de todo tipo de error, y su número fue relativamente pequeño.

    En comparación, a un programa de Data Mining se le podría dar un historial de facturación de un supermercado para que halle relaciones. La base de datos podría provenir, por ejemplo, del departamento de Contablidad, y contendría varios miles de transacciones. Tal vez en varias de éstas la cajera capturó mal el producto o el precio. Finalmente, el programa reportaría, por ejemplo, que los discos de rock se compran en su mayoría los fines de semana.

    Redes Neuronales, Razonamiento Basado en Casos y Geometría Fractal como Data Mining

    El término Data Mining es usado de diferentes maneras en la literatura. Frecuentemente se extiende el significado a cualquier técnica usada para sacar provecho a grandes cantidades de datos almacenados. Sin embargo, únicamente con Data Mining se extrae propiamente conocimiento de los datos.

    Por ejemplo, las Redes Neuronales son una herramienta excelente para predecir resultados en base a historiales. Sin embargo, dado que actúan como "cajas negras", no es posible hallar el razonamiento atrás de las predicciones.

    También el Razonamiento Basado en Casos es considerado efectivo en la explotación de grandes cantidades de datos. El método consiste en buscar la solución a un problema simplemente analizando lo que se hizo en otro problema muy similar en el pasado. En otras palabras, se trata de Razonamiento por Analogía, y no Inductivo. Aunque esta técnica sirve de apoyo en la resolución de problemas, no nos dice mucho acerca de la información alamacenada en la base de datos: el conocimiento sigue en forma latente.

    La Geometría Fractal permite comprimir grandes cantidades de datos, y aún así poder analizarlos en un tiempo razonable. Esto no representa ningún tipo de automatización de razonamiento, simplemente es una ayuda técnica en la manipulación de los datos.

    Aún así, éstas son herramientas de mucho valor, y complementan la extracción de conocimientos propia de Data Mining.

    Notas

  • Siga esta liga para explorar los recursos sobre Data Mining en el Internet.
  • En especial, se recomienda el reporte técnico Data Mining: the search for knowledge in databases (Postscript) del Centro de Investigación en Informática de Holanda, escrito por Marcel Holsheimer y Arno Siebes.

    Referencias


  • Herramientas para el Desarrollo de GUI's (IHC-5)

    El uso de herramientas orientadas a objetos en la implementaci&oaucte;n de GUI's es cada día más común. Sin embargo, el usuario tiene dificultades al tratar de seleccionar una herramienta de este tipo, de entre las varias herramientas similares que existen en el mercado. Este artículo presenta, de una manera interesante, los puntos que un implementador de GUI's debe considerar al seleccionar una herramienta basada en la filosofía de Programación Orientada a Objetos. Se mencionan los diferentes tipos de herramientas de esta clase, y finalmente se proporciona una lista de las diferentes compañías que las venden. (En inglés).

    Linthicum, D. (1995) GUI Development Tools, Open Computing On Line, marzo 1995, sin referencias.

  • Principios para el buen Diseño de GUI's (IHC-6)

    El uso de Interfaces Gráficas para el Usuario (GUI's) se ha convertido en la elección común para el desarrollo de interfaces con el usuario. Sin embargo, pocas aplicaciones tienen un buen diseño de la interface. El artículo describe las reglas básicas para el diseño de una buena interface. (En inglés).

    Hobart, J. (1995) Principles of Good GUI Design, Unix Review, vol. 13, núm. 10, septiembre 1995, pp. 37-46, sin referencias.

  • Aplicaciones de la Visualización Científica (GRA-5)

    Este artículo describe cómo la Visualización Científica es aplicada en la investigación. Se enumeran los orígenes de la Visualización Científica, aplicaciones actuales y próximos horizontes. Se presentan fragmentos de entrevistas a investigadores de esta disciplina, los cuales hablan sobre las herramientas, datos y técnicas que utilizan. Es un excelente artículo que da un panorama perfecto del papel de la Visualización Científica en la investigación. (En inglés).

    Mahoney, D.P. (1995). Unlocking the mysteries of science, Computer Graphics World, núm. 7, vol. 18, julio 1995, pp. 22-33, sin referencias.

  • AutoCAD versión 13 en detalle (GRA-6)

    Se da una descripción detallada de las mejoras y adiciones realizadas a la versión 13 de AutoCAD con respecto a las anteriores. Es un artículo amplio donde se describen características nuevas de esta versión en cuanto a: manejo de texto, dimensionamiento, ashurado asociativo, interface de desarrollo, modelado y render; así como la compatibilidad con versiones anteriores. Asimismo, se enumeran las políticas para actualizarse de versiones anteriores y documentación disponible y formatos. (En inglés)

    Sheerin, P. (1994), Taking apart release 13, CADENCE, núm 12, vol. 9, diciembre 1994, pp. 37-52, sin referencias.

  • Programación genérica : un complemento a la programación oriendada a objetos (POO-5)

    Este artículo proporciona un buen punto de partida para conocer qué es la programacion genérica y su importancia dentro del contexto de la programación orientada a objetos. Introduce al uso de la biblioteca estándar de templates: STL (Standard Template Library). (En inglés).

    Zigmond, D. (1995). Generic programming and the C++ STL, Dr. Dobb's Journal, núm. 223, agosto 1995, pp. 18-24, sin referencias.

  • Programacion genérica (POO-6)

    Este artículo trata sobre los conceptos y la importancia de la programación genérica y su uso en C++. El documento fue escrito por los creadores de STL (Standard Template Library). (En inglés)

    Musser, D. & Stepanov, A. (1994). Algorithm-Oriented Generic Libraries, Software - Practice & Experience, vol. 24, núm 7, pp. 623-642, julio de 1994, sin referencias.

  • Aplicaciones de Data Mining (SBC-5)

    Explica el concepto de Data Mining (búsqueda de relaciones y patrones globales escondidos en grandes bases de datos) utilizando en un ejemplo sencillo. Se analizan cuatro métodos para extraer información: Redes Neuronales, Redes Abductivas, Rough Sets y Modelación Universal de Procesos. (En inglés)

    Lewinson, L. (1993). Data Mining: Intelligent Technology Gets Down to Business, PC AI, vol 7, núm 6, pp 16-23, noviembre/diciembre 1993, sin referencias.

  • Tecnología de fractales para compresión de datos (SBC-6)

    La tecnología de fractales, utilizada por Microsoft para comprimir imágenes en sus productos CD-ROM, puede ser utilizada también para comprimir bases de datos de millones y hasta miles de millones de datos y ser posteriorment analizada en una PC en tiempo real. Este artículo describe un producto que utiliza esta tecnología. (En inglés)

    Lewinson, L. (1994). Fractal Databases - New Horizons in Database Management, PC AI, vol 8, núm 2, pp 30-33, marzo/abril 1994, sin referencias.

  • Tres formas de analizar grandes cantidades de datos (SBD-5)

    Las grandes cantidades de datos acumulados por las compañías podrían tener un mejor destino que un uso ocasional o su olvido total. Este artículo analiza tres métodos para sacar provecho a esos datos, a veces con resultados sorprendentes: Redes Neuronales, Geometría Fractal y Razonamiento Basado en Casos. (En inglés)

    Lewinson, L. (1994). Data Mining: Tapping the Mother Lode, Database Programming and Design, vol 7, núm 2, febrero 1994, pp. 50-56, sin referencias.


  • Una llave a la calidad en los datos (SBD-6)

    Es indispensable que los datos en que se basa un decisión no contengan errores, de otra manera se produciría un desastre seguro. Para evitar esto, existen los Sistemas Inteligentes de Calidad de Bases de Datos, que utilizan tanto sistemas de reglas (Sistemas Expertos) como razonamiento inductivo (Data Mining) para monitorear los datos y así detectar tanto faltas en la satisfacción de restricciones como movimientos fuera de los patrones establecidos. (En inglés)

    Parsaye, K. y Chignell, M. (1995). Quality Unbound, Database Programming and Design, vol 8, núm 1, enero 1995, pp. 38-42, 3 referencias.




    Noticias

  • La especialidad de Sistemas Basados en Conocimientos de la Línea E ha recopilado una serie de documentos sobre Sistemas Complejos Adaptivos. Se encuentran trabajos de Langton, Resnick, Crutchfield, Forrest, Hiebeler, Steels y Mataric, y reportes ténicos del Santa Fe Institute y Sussex University Cognitive Science Group (COGS). Todos los documentos se encuentran disponibles en archivos. Para mayor información, contactar a Héctor Jasso en la extensión 7008.

  • El manual del curso Introducción a los Servicios de Internet ha sido puesto en el servidor interno del Instituto. Consúltelo siguiendo esta liga.

    Sugerencias y Comentarios

    Para enviar sugerencias y comentarios, o para pedir mayor información relacionada con Monitor, comunicarse con Héctor Jasso (ext. 7008, o mediante correo electrónico, dirección hjasso@axp5.iie.org.mx).