sábado, octubre 08, 2005

Charla en el MPI 05.10.2005

El pasado miércoles 5 de octubre el Profesor Dmitrij Frishman de la Universidad Técnica de Munich ofreció una charla en el MPI de Fisiología Molecular de Plantas (Golm, Alemania) titulada "Understanding protein-protein interactions by comparative genome analysis".

El principal objetivo de la charla fue presentar DIMA (Domain Interaction MAp). La idea de esta aplicación es predecir interacciones entre proteínas tomando como punto de partida los perfiles filogenéticos(phylogenetic profiles) de los dominios que se encuentran presentes en estas proteínas.

Es importante aclarar que la definición de "interacción" utilizada por los desarrolladores de DIMA, incluye tanto las interacciones funcionales como las físicas.

Los conceptos en los que se fundamenta esta aplicacion son los siguientes:

  • Un proteína(dominio) que participa en alguna interacción tiende a ser conservada(o)
  • El par que interactúa tiene una mayor probabilidad de ser conservado en diferentes genomas.
La principal ventaja del sistema es la rapidez con que se puede actualizar cuando se adicionan nuevas proteínas. El desarrollo de DIMA se motivó en STRING, una aplicación similar pero basada en la predicción de ortólogos en función de la similaridad entre secuencias de proteínas. Los esudios realizados hasta el momento han mostrado que el sobrelapamiento entre DIMA y STRING es bastante reducido, lo que sugiere su complementariedad.

¿Cómo funciona?

El concepto es muy sencillo, basado, como ya lo mencione, en los perfiles filogenéticos de dominios de proteinas.
Es necesario contar con el conjuto completo de proteínas de diferentes genomas.
Los dominios presentes en estas proteínas pueden ser encontrados utilizando diferentes estrategias, entre ellas, posiblemente la mejor, está PFAM.
Una vez los dominios se han localizado, se procede a crear una matriz de presencia/ausencia. Cada fila corresponde a un genoma, y cada columna a un dominio particular. Una celda corresponde a la presencia de un dominio dado en un genoma particular, y puede tomar uno de dos valores, 1 si el dominio se encuentra presente en ese genoma, o, 0 en caso contrario.

El conjuto de 0s y 1s para un dominio, recibe el nombre de "cadena de bits" (bit string)

El siguiente paso es el cálculo de alguna medida de distancia entre dominios. Generalmente se aplica un filtro antes del cómüputo de la similaridad, con el objetivo de eliminar aquellos dominos con bajo contenido de información (de acuerdo a la definión de información de Shannon), de esta forma aquellos dominios ubicuos y aquellos exclusivos de un solo genoma son eliminados.

La evaluación de similaridad permite agrupar a los dominios, los dominios pertenecientes a un grupo corresponden a las predicciones de dominos que interactúan. Estos grupos de dominios se mapean en alguno de los genomas de interés, el resultado es la predicción de interacciones entre proteínas en el genoma deseado.

El grupo del Prof. Frishman ha probado esta aplicación con el genoma de Saccharomyces cerevisiae, con resultados prometedores, aquí pueden obtener mayor información.

Además de la predicción de interacciones, uno podría usar DIMA para predecir ortólogos que tengan poca similaridad a nivel de secuencia. Por ejemplo, supongamos que se tiene un par de proteínas homólogas, cuya similiridad es muy baja, pero que aún conservan un estructura (arquitectura) de dominios muy similar.
Tratar de definir la homología entre este par de proteínas es muy difícil utilizando herramientas comunes como el BLAST recíproco, en cambio empleando DIMA, o alguna variante que se apoye en los mismo conceptos, se podría "fácilmente" inferir que las dos proteínas son efectivamente homólogas.

En resumen, DIMA es una herramienta que ofrece hipótesis sobre interacciones entre proteínas, que pueden ser directamente probadas en el laboratorio.

No hay comentarios.: