martes, noviembre 15, 2005

ECCS 2005 Sesion de la mañnana 15.11

Dos excelentes presentaciones:

Primera por Tamas Vicsek presentando su enfoque sobre extracción de comunidades en redes complejas, muy intereante. Básicamente lo que presentó se encuentra en su artículo de Nature. Para resaltar, está el hecho de que la forma de buscar comunidades propuestas acepta el sobrelapamiento de comunidades, un nodo puede pertenecer a mas de una comunidad, de la misma forma en que una persona, por ejemplo, pertenece a varias comunidades: profesionales, familia, deportes, etc. Esta es la principal diferencia con modelos anteriores jerárquicos en los que una vez un nodo dado es asignado a una comunidad, este ya no puede pertenecder a otra. La utilidad de este enfoque fue demostrada analizando redes de colaboración cientifica, asociación de palabras y de interacciónm de proteínas, con excelentes resultados.
En el caso de interacciones entre proteínas es interesante que el grupo de Vicsek encontró por un lado que diferentes comunidades a las que pertenece una protein, reflejan diferentes funciones, y por otro lado que encontrar que una proteina pertenece a una comundad dada podría azudar a asignar una función a esa proteína, algo que es de gran utilidad en la anotación de genomas.

Segunda por Henrik Lund de Dinamarca, presentando ¨Legos inteligentes¨, para ayudar en el desarrollo de habilidades cognitivas a niños con problemas de aprendizaje (dislexia) y/o para "combatir" los problemas de obesidad infantil, haciendo que los niños se muevan mas mientras juegan con robots.
Es un enfoque interesante, pero controversial. Parte de la idea de fomentar la actividad fisica, mediante el juego, en niños con el fin de dismunir la tasa de obesidad infantil, puede que cumpla con el fin, pero en el camino parte de la actividad creativa en el juego se pierde, y es el ¨lego¨quien dirige la actividad de manera autónoma . . . Claro, es un primer prototipo y seguramente esto podra recibir mas atención y otras forma de interacción prodrán ser implementadas.

Mas información se puede encontrar en www.adaptronics.dk.

lunes, noviembre 14, 2005

ECCS 2005 Sesion de la tarde 14.11

Hubo una charla muy interesante en la sesión de la tarde. Fue presentada por Marc Barthelemy.

Los principales puntos de la charla fueron:

1. Hay mas que topología en una red. Hasta ahora la moyoria de modelos y descripciones de redes se han enfocado en la topología: distribución de probabilidad del grado de un vertice, clustering, etc.

2. Los pesos de los vinculos son importantes. Por ejemplo el tráfico en redes de transporte aéreo, los flujos heterogeneos en redes metabólicas, etc.

Puede ser diferente un nodo con muchos vinculos, pero poco tráfico por vínculo a uno con pocos vínculos pero con mucho tráfico por vínculo.

ECCS 2005 Introduccion

Hoy comenzó la "European Conference on Complex Systems", voy a tratar de mantener esta bitácora.

En la sección introductoria encontré tres aspectos que resultan bastante interesantes:

  • Uno de los coordinadores se referió brevemente a los disturbios que se han presentado en las ultimas semanas en Paris, lo interesante es el vínculo entre estos disturbios y los desarrollos de las tecnologías de la información en los últimos años. Sin Internet y Mensajes de Texto en los celulares difícilmente habrian habido disturbios. Una consecuencia de nuestra sociedad interconectada.

  • Michel Rocard, el anterior Primer Ministro Francés, parece estar sinceramente interesado en las ciencias de la complejidad, y en la manera en que estas pueden ayudar a resolver problemas reales, como por ejemplo, la creación de oportunidades de empleo sin incrementar la inflación, entre otras.

  • Georges Haddad, Científico que ha trabajado en complejidad y ahora Director de la División de Educacion Superior de la UNESCO, dió una charla interesante aunque un poco larga

    Lo mas interesante fue una crítica a algunas imposiciones del Banco Monetario Internacional a algunos paises en vias de desarrollo. No recuerdo que paises mencionó, pero la obligación era crear 20000 posiciones para profesores universitarios en unos cuantos meses. Lo cual es una completa irresponsabilidad. Como se van a capacitar en pocos meses tantos
    profesores, se va a sacrificar calidad por cantidad, desafortunadamente.


  • Eso fue lo mas interesante en la sesión de la mañana. En la tarde se inicia la sesión sobre modelado de redes, que voy a seguir a lo largo de estos tres días.

    martes, noviembre 01, 2005

    Scriptoma (Scriptome)

    El "scriptoma" es una colección de scripts en perl (one-liners) para el procesamiento de datos, que se ejecutan en la línea de comandos en cualquier sistema operativo, el único requisito es tener Perl instalado. Recientemente el scriptoma ha aparecido en varias fuentes de noticias (nodalpoint, perl.com), lo que motivo este post.

    Yo vi los primeros mensajes sobre el proyecto en la lista de correo de bioperl, por allá en mayo de 2005, y empecé a usarlo hace un par de meses. Para mí el scriptoma ha sido de bastante utilidad. Yo me considero un usuario avanzado de perl, pero nunca le he prestado mucha atención a los one-liners, y este proyecto me presenta la oportunidad de llenar ese vacío.

    El objetivo de los creadores del scriptoma es que biólogos no programadores (BNP) lo usen en sus tareas simples de procesamiento de datos. Tareas tales como: ordenar por la tercera columna en orden ascendente un archivo de texto separado por tabulaciones con 50000 registros, obtener un estadístico dado en la quinta columna, unir dos archivos mediante una clave común, extraer los casos comunes entre dos archivos, etc.

    Puede resultar doloroso tratar de resolver algunas de estas tareas usando una hoja de cálculo, devido al elevado número de registos, en cambio con un pequeño script la tarea se lleva a cabo en unos poco segundos. Alternativamente para unir archivos mediante claves comunes uno podría usar MS-Access o cualquier otro cliente SQL (MySQL es mi favorito), pero la mayoría de los BNPs no están interesados en aprender a usar MS-Access, por un lado, y por otro, el scriptoma tiene un rango mucho mas amplio de utilidad.

    Para los biólogos programadores el scriptoma es útil por que demuestra el poder de perl en una sola línea de comando, y se pueden aprender varios trucos y atajos de esta forma. Para los BNPs, cada script se puede usar como una caja negra (que es lo que generalmente los BNPs piden, quieren) a la que se le dan los datos en cierto formato y se obtiene un resultado, obviamente el resultado será bastante simple: ordenar una columna, obtener el valor medio de otra, etc. Pero este es necesariamente el primer paso para análisis mas interesantes.

    No me cabe duda de que el scriptoma será de muchísima utilidad para los biólogos que vengan con intenciones de programar. En cambio, dudas aparecen en cuánto a la utilidad que le puedan prestar a los BNPs en la realidad, principalmente por el desdeño que muestran hacia el uso de computadores de formas inteligentes, muchas veces prefieren "cortar y pegar" por horas.

    martes, octubre 18, 2005

    Qué es Web 2.0?

    Ya hace algún tiempo que se viene hablando de la web2.0, es la nueva moda.

    Pero detrás de la moda y lo "cool" que pueda ser, hay algunas características que en realidad han cambiado drásticamente en la web, o mejor, se han creado nuevos servicios que facilitan la interacción entre personas, la comunicación se ha vuelto mucho más dinámica a través de este medio. Tambien es importante señalar que a muchos de estos servicios se accede con un único programa: el navegador (p.e. Firefox)

    Entre esos nuevos servicios, se pueden listar:

    • PodCast(radio)
    • Blogs(noticias)
    • RSS
    • Wiki(colaboración)
    • WebServices
    • Etiquetado(tagging)(clasificación, organización)
    • P2P(distribución)

    Pero esta es apenas una pequeña muestra, y es muy posible que en los próximos años seamos testigos de una mayor migración de servicios hacia la web, de pronto una "suite" de oficina en el navegador, que facilite la elaboración de libros, artículos, de forma mucho más amigable que una wiki?

    Es una transición en la forma en la que utilizamos servicios computacionales y en la que interactuamos con otros en el ciberespacio. Es una transición hacia un sistema muchos mas distribuido, más dinámico, en el que, en cierto sentido, estamos mas cerca unos de otros.

    Para mayor información leer:

    http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html
    http://radar.oreilly.com/archives/2005/08/not_20.html
    http://www.web2con.com/

    domingo, octubre 09, 2005

    Nueva revista: Biology direct

    Biology Direct. Una nueva revista en el área de ciencia biológicas, con enfásis en biología computacional, genómica y biología de sistemas. Hace parte del sistema "open access", y sus editores proponen un nuevo sistema de "peer review", en el cual los autores deben escoger a sus revisores y, mucho mas importante, los comentarios de los revisores podrán ser publicados junto con el artículo.

    Un intento por mejorar el sistema de "peer review"

    sábado, octubre 08, 2005

    Charla en el MPI 05.10.2005

    El pasado miércoles 5 de octubre el Profesor Dmitrij Frishman de la Universidad Técnica de Munich ofreció una charla en el MPI de Fisiología Molecular de Plantas (Golm, Alemania) titulada "Understanding protein-protein interactions by comparative genome analysis".

    El principal objetivo de la charla fue presentar DIMA (Domain Interaction MAp). La idea de esta aplicación es predecir interacciones entre proteínas tomando como punto de partida los perfiles filogenéticos(phylogenetic profiles) de los dominios que se encuentran presentes en estas proteínas.

    Es importante aclarar que la definición de "interacción" utilizada por los desarrolladores de DIMA, incluye tanto las interacciones funcionales como las físicas.

    Los conceptos en los que se fundamenta esta aplicacion son los siguientes:

    • Un proteína(dominio) que participa en alguna interacción tiende a ser conservada(o)
    • El par que interactúa tiene una mayor probabilidad de ser conservado en diferentes genomas.
    La principal ventaja del sistema es la rapidez con que se puede actualizar cuando se adicionan nuevas proteínas. El desarrollo de DIMA se motivó en STRING, una aplicación similar pero basada en la predicción de ortólogos en función de la similaridad entre secuencias de proteínas. Los esudios realizados hasta el momento han mostrado que el sobrelapamiento entre DIMA y STRING es bastante reducido, lo que sugiere su complementariedad.

    ¿Cómo funciona?

    El concepto es muy sencillo, basado, como ya lo mencione, en los perfiles filogenéticos de dominios de proteinas.
    Es necesario contar con el conjuto completo de proteínas de diferentes genomas.
    Los dominios presentes en estas proteínas pueden ser encontrados utilizando diferentes estrategias, entre ellas, posiblemente la mejor, está PFAM.
    Una vez los dominios se han localizado, se procede a crear una matriz de presencia/ausencia. Cada fila corresponde a un genoma, y cada columna a un dominio particular. Una celda corresponde a la presencia de un dominio dado en un genoma particular, y puede tomar uno de dos valores, 1 si el dominio se encuentra presente en ese genoma, o, 0 en caso contrario.

    El conjuto de 0s y 1s para un dominio, recibe el nombre de "cadena de bits" (bit string)

    El siguiente paso es el cálculo de alguna medida de distancia entre dominios. Generalmente se aplica un filtro antes del cómüputo de la similaridad, con el objetivo de eliminar aquellos dominos con bajo contenido de información (de acuerdo a la definión de información de Shannon), de esta forma aquellos dominios ubicuos y aquellos exclusivos de un solo genoma son eliminados.

    La evaluación de similaridad permite agrupar a los dominios, los dominios pertenecientes a un grupo corresponden a las predicciones de dominos que interactúan. Estos grupos de dominios se mapean en alguno de los genomas de interés, el resultado es la predicción de interacciones entre proteínas en el genoma deseado.

    El grupo del Prof. Frishman ha probado esta aplicación con el genoma de Saccharomyces cerevisiae, con resultados prometedores, aquí pueden obtener mayor información.

    Además de la predicción de interacciones, uno podría usar DIMA para predecir ortólogos que tengan poca similaridad a nivel de secuencia. Por ejemplo, supongamos que se tiene un par de proteínas homólogas, cuya similiridad es muy baja, pero que aún conservan un estructura (arquitectura) de dominios muy similar.
    Tratar de definir la homología entre este par de proteínas es muy difícil utilizando herramientas comunes como el BLAST recíproco, en cambio empleando DIMA, o alguna variante que se apoye en los mismo conceptos, se podría "fácilmente" inferir que las dos proteínas son efectivamente homólogas.

    En resumen, DIMA es una herramienta que ofrece hipótesis sobre interacciones entre proteínas, que pueden ser directamente probadas en el laboratorio.

    jueves, octubre 06, 2005

    empezando . . .

    OK, este es mi primer paso en la blogosfera . . .

    La principal idea que motivó la creación de este blog fue divulgar ideas y conceptos de bioinformática, el área en la que trabajo actualmente.

    Pretendo publicar ideas sobre artículos recientes, aplicaciones y de pronto una que otra reflexión. Ya veremos como evoluciona este espacio. Espero que algunos de los "post" merezcan comentarios!

    Obviamente no faltará alguna propaganda.

    En mi sitio web hay mas info sobre mis actividades.