domingo, agosto 06, 2006

ISMB2006, Agosto 6: Tutoriales

Hoy comenzó para mí la conferencia.

Asistí a dos tutoriales uno en la mañana (Biological literature mining: from information retrieval to biological discovery) y otro en la tarde (Bayesian networks for bioinformatics: an introduction to inference and learning).

El primero trataba sobre como usar la literatura existente (principalmente resúmenes de artículos en MEDLINE, con opción de textos completos disponibles en PUBMED Central) para hacer descubrimientos/hipótesis de carácter biólogico. Entre los problemas/retos mencionados, está el de identificar las entidades interesantes, nombres de gene/proteínas por ejemplo. Parte del problema radica en que algunas veces esas entidades reciben nombres no muy inteligentes, desde el punto de vista de la explotación de textos, como la proteína THE, o SDS. La primera un artículo muy común en inglés y la segunda un reactivo común en la preparación de geles. Otro problema mencionado radica en la ambiguedad de algunos términos. Ciertas entidades pueden usarse con diferentes significados. Al parecer la única solución a este problema en el momento es la participación de un experto humano. A pesar de los problemas que se mencionaron, está área es muy prometedora, la razón más clara, que fue mencionada en el turtorial, es que la cantidad de literatura disponible es tan grande que nadie es capaz de leerla toda, ni siquiera en un campo especializado, y por lo tanto conexiones entre hechos aislados pueden pasar desapercibidas. Las técnicas de explotación de textos (literature mining) pueden solucionar esto en gran medida, solo es cuestión de que se empiecen a usar mas. Una de las herramientas para el usuario final que más me intereso fue iHOP.

El segundo tutorial al que asistí trataba sobre redes bayesianas: cómo inferir sus parametros, la estructura y las relaciones causales (dirección de las aristas) a partir de datos. El principal problema es la inferencia de las relaciones causales, para lo cual se necesitan experimentos "bien pensados" en el laboratorio. Lo que de alguna forma le resta eficiencia (high-throughput).

Por hoy eso fue todo. Mañana tenemos las conferencias.

No hay comentarios.: