Eterno bucle

jueves, mayo 05, 2011

El genoma de Selaginella nos permite encontrar cambios en el contenido genético asociados con la evolución de las plantas vasculares

Acaba de salir publicado el artículo que describe el genoma de Selaginella moellendorfii. Tuve la oportunidad de participar en ese estudio y creo que es buena idea re-activar este espacio con un resumen corto.

Selaginella es una planta terreste y que cuenta con un sistema vascular verdadero.

Foto: Selaginella moellendorffii (Jing-Ke Weng, Salk University)

Las plantas que colonizaron el ambiente terrestre empezaron a divergir hace mas de 450 millones de años. Los principales linajes que existen actualmente, resultado de esa divergencia, son los musgos, los licófitos y las plantas con hojas verdaderas (helechos y plantas con semillas). Selaginella es un licófito.

Desde el año 2000 conocemos los genomas completos de varias angiospermas (plantas con flores), e.g., Arabidopsis thaliana (prima de la mostaza), Oryza sativa (arroz). Desde el 2008 conocemos el genoma completo del musgo Physcomitrella patens, lo que nos permitió proponer algunos rasgos moleculares importantes en la colonización del ambiente terrestre. Pero para conocer las características moleculares que llevaron al desarrollo de vasos de transporte reales de nutrientes en las plantas era necesario conocer el genoma de un licófito, como la Selaginella moellendorfii. El estudio de este organismo nos permitió inferir, a partir de la comparación con otras plantas, que el desarrollo del sistema vascular requirió de la evolución de 516 genes nuevos, y que el desarrolló de las semillas se vio facilitado por la innovación representada en 1350 genes más.

En el desarrollo de esta investigación participaron mas de 100 investigadores de 11 países alrededor del mundo. Este estudio fue liderado por la Dra. Jo Ann Banks de la Universidad de Purdue en Estados Unidos de América. La participación de Joint Genome Institute adscrito al Departamento de Energía de Estados Unidos de América, aseguró el éxito del trabajo.

En Colombia las especies del genero Selaginella se conocen como doradilla y se emplean principalmente como plantas ornamentales. En Colombia, se encuentra principalmente en los departamentos de Amazonas, Caquetá, Cuaca, Guainía, Guaviare, Meta, Nariño, Vaupés y Vichada.

jueves, julio 15, 2010

Sobre las bolas de pelos: ridiculogramas

Quien no ha visto una imagen de una red? de internet, de reguladores de transcripción o de interacción entre proteínas?

Imagen tomada de http://www.bordalierinstitute.com/images/yeastProteinInteractionNetwork.jpg

Hoy en día son muy comunes y llaman mucho la atención. De hecho, uno de mis intereses particulares es estudiar la topología de esas redes y ver como responden a las perturbaciones.

Sin embargo la típica representación visual como bolitas y palitos no es muy útil, por eso ahora se les llama en forma generalizada 'bolas de pelos', incluso M. E. J. Newman, un experto en análisis de redes, las llama 'ridiculogramas'.

Un ridiculograma tiene las siguientes características:

* visualmente deslumbrantes.
* Sin valor científico.
* Publicados en Science o Nature.

lunes, julio 12, 2010

Ola de calor . . . y los servidores!

Este verano (2010) en el nor-este de Alemania hemos tenido temperaturas llegado a los 40°C, algo muy poco usual y que por supuesto ha estado estresando mas de la cuenta a los sistemas de refrigeración de nuestros cuartos de servidores.

Esta situación me llevo a instalar y configurar el paquete lm_sensors en mis servidores con CentOS. En principio todo era cuestión de instalar el paquete, detectar los sensores disponibles en el hardware (sensors-detect), cargar alguno módulos en memoria y revisar la temperatura con el comando
'sensors'. claro, la vida no es fácil, y el modulo coretemp que se necesitaba no esta instalado en CentOs, a pesar de que es incluido por defecto en versiones del kernel >= 2.6.22, pero la versión mas actual de CentOs 5.4 es 2.6.18. Ya me veía compilando el kernel y el modulo faltante.

Afortunadamente antes de enfrentar tan emocionante tarea hice una búsqueda que me ayudó a encontrar este sitio, en donde precisamente cuentan como instalar el modulo coretemp en centos 5.4.

En resumen:

1.- Descargar el rpm del modulo para el sistema deseado, en mi caso fue e15
2.- Instalar el modulo rpm -ivh kmod-coretemp-1.1-2.el5.x86_64.rpm
3.- ejecutrar (como root) sensors-detect
4.- ejecutar sensors, para ver las lecturas actuales de temperatura.

A este punto los sensores deben estar funcionando, claro con algo de suerte.

Para facilitar un poco el monitoreo escribí (partiendo de otro script que encontré en la web, pero cuya ubicación no recuerdo .-() un pequeño script de Perl que ejecuta 'sensors', guarda los datos en una base rrd, y crea las gráficas correspondientes al comportamiento de la temperatura. El script se puede ejecutar via cron, colectando datos cada 5 minutos.

Aquí esta el script:


#!/usr/bin/perl

use strict;
use warnings;
use RRDs;

# rrdtool databases
my $rrd = '/path/to/rrd/database/';
# output location of images
my $img = '/path/to/rrd/output/graphics/';

&CoreTemp();

sub CoreTemp{
 my %cores;
 my @CoreTemp=`sensors |grep Core`;
 foreach my $line(@CoreTemp){
  chomp $line;
  if($line=~/^Core\s+(\d+):\s+([+-]\d+)°C/){
   $cores{$1}=$2;
  }
 }
 foreach my $core(keys %cores){
  #if rrdtool database doesn't exist, create it
  my $rrd_db="tempcore".$core.".rrd";
  if(! -e "$rrd/$rrd_db"){
    print "Creating RDD DB $rrd_db in $rrd . . . \n";
    RRDs::create "$rrd/$rrd_db",
                "-s 300",
                "DS:temp:GAUGE:600:0:100",
                "RRA:AVERAGE:0.5:1:576",
                "RRA:AVERAGE:0.5:6:672",
                "RRA:AVERAGE:0.5:24:732",
                "RRA:AVERAGE:0.5:144:1460";
  }
  # insert value into rrd
  RRDs::update "$rrd/$rrd_db",
                "-t", "temp",
                "N:$cores{$core}";
  CreateGraph($core, "day");
  CreateGraph($core, "week");
  CreateGraph($core, "month");
  CreateGraph($core, "year");
 }
}

sub CreateGraph{
 my ($core,$interval)=@_;
 print "$core,$interval\n";
 my $rrd_db="tempcore".$core.".rrd";
 my $img_file="core".$core."-".$interval.".png";
        RRDs::graph "$img/$img_file",
                "--lazy",
                "-s -1$interval",
                "-t core temperature :: Core $core ",
                "-h", "80", "-w", "600",
                "-a", "PNG",
                "-v degrees C",
                "DEF:temp=$rrd/$rrd_db:temp:AVERAGE",
                "LINE2:temp#0000FF:$core (Core $core)",
                "GPRINT:temp:MIN:  Min\\: %2.lf",
                "GPRINT:temp:MAX: Max\\: %2.lf",
                "GPRINT:temp:AVERAGE: Avg\\: %4.1lf",
                "GPRINT:temp:LAST: Current\\: %2.lf degrees C\\n";
        if (RRDs::error) { print "$0: unable to generate Core $core graph: $RRDs::error\n"; }
}

martes, junio 22, 2010

The foundation of scientific integrity - Richard P. Feynman

“The first principle is that you must not fool yourself—and you are the easiest person to fool.... After you’ve not fooled yourself, it’s easy not to fool other scientists. You just have to be honest in a conventional way after that.”

via: Scientific American

domingo, agosto 30, 2009

pensamientos . . .

La charla de Clifford Stoll in TED es espectacular, queda recomendada.

Entre las muchas cosas que dijo me gustó esta:

The first time you do something it’s science.
The second time it’s engineering.
The third time, you’re a technician.

jueves, febrero 12, 2009

Darwin day

Hoy hace 200 años nació Charles Robert Darwin , y en noviembre hace 150 años publicó su libro: Sobre el origen de la especies por medio de la selección natural. Para muchos Darwin es el Newton de la biología y como bien lo dijo Theodosius Dobzhansky, nada en biología tiene sentido si no se mira a través de la luz de la evolución.

Aquí les dejo uno de los primeros árboles filogenéticos, este apareció en uno de los cuadernos de notas de Darwin.

Feliz día!

domingo, octubre 05, 2008

Factores de transcripción en las plantas

Este es el tema de mi tesis de doctorado y en estos momentos estoy preparando la presentación final de mi trabajo de los últimos 4 años. Buscando formas novedosas de visualizar algunos datos me encontré con Many Eyes, espectacular.

Aquí les dejos algunoas de los gráficos que creé del número de factores de transcripción por especie y por familia de factores.

viernes, septiembre 19, 2008

GCB 2008 - charlas sobresalientes

La semana que pasó estuve en Dresden asistiendo a la conferencia alemana de bioinformática. En general el nivel de las charlas fue muy bueno. Dos de las "keynotes" me parecieron excelentes, la de Trey Ideker y la de Michael Ashburner. La primera trató sobre biología de sistemas, y la segunda sobre el uso, pasado, presente y futuro de las ontologías en biología.

Les dejo una pequeña presentación en PDF con los principales puntos de las charlas.

miércoles, septiembre 10, 2008

GCB 2008 en Dresden

Esta semana se lleva acabo la conferencia alemana de bioinformática (GCB2008) en la hermosa ciudad de Dresden, los organizadores han escogido el museo alemán de la higiene como sede del evento.

Aquí les dejo una mujestra de una de las maravillas que se encuentran en las cercanías del museo.

Mas adelante habrá una entrada con un resumen de las presentaciones que mas me impactaron/interesaron. Hasta la próxima.

martes, septiembre 02, 2008

Evolución de las plantas I

Las plantas son organismos eucarióticos fotosintéticos, lo que quiere decir que 'fabrican' los materiales que necesitan para vivir a partir de agua, dióxido de carbono y luz solar.

Las plantas aparecen en la tierra aproximadamente hace 1.400 millones de años, cuando una célula eucariótica que se alimentaba de cianobacterias (bacterias con la capacidad de hacer fotosíntesis), no digirió a la bacteria sino que la mantuvo intacta en su citoplasma. Con el tiempo y las generaciones esta bacteria se convirtió en un simbionte, que fue reduciendo de tamaño y pasó a depender completamente del organismo hospedero, convirtiéndose de hecho en un organelo de este, el cloroplasto, que es el organelo en donde tiene lugar la fotosíntesis. Este proceso se conoce como endosimbiosis, y ha ocurrido varias veces a lo largo de la evolución.

La siguente figura resume las relaciones evolutivas de los principales grupos de plantas existentes hoy en día. De la endosimbiosis original hace mas de 1.400 millones de años se derivaron tres grupos principales, las glaucofitas, las algas rojas (rhodophyta) y las plantas verdes (Chloroplastida). La inmensa mayoría de las plantas que conocemos y que están en nuestras casas son de este último tipo.

Ya vendrá mas información relacionada con la evolución de estos maravillosos organismos.

lunes, agosto 11, 2008

tesis: la frontera final

Estoy a punto de por fin entregar mi tesis de doctorado.

Luego de entregarla tengo que esperar approx. 2 meses por las evaluaciones de 4 expertos en mi área de trabajo. Si las evaluaciones recomiendan continuar con el proceso tendré que hacer una presentación pública de mi trabajo. Así que este apenas es el principio del final!

Mientras tanto aquí les dejo un representación gráfica de lo que hice en los últimos años.

La nube de palabras (word cloud) fue creada con Wordle

domingo, junio 01, 2008

Bio-números

De vez en cuando, en el marco de diferentes análisis es importante hacer referencia a diferentes propiedades numéricas de los organismos, como número de chromosomas, tamaño del genoma, número de tipos celulares, etc. Y siempre toma bastante tiempo encontrar las referencias primarias. Afortunadamente un equipo del departamento de biología de sistema en harvard, decidio crear una base de datos, Bionumbers, en la cual almacenar y hacer públicos esos datos, con referencias a los reportes originales.

Además, cualquiera, luego de registrarse, puede agregar nuevos números biológicos, siguiendo la misma filosofía de la wikipedia.

Así que, a agregar mas bio-números.

martes, mayo 13, 2008

Albert Einstein on Religions from a letter to Jewish philosopher Eric Gutkind

Palabras de Don Albert Einstein sobre sus creencias religiosas:

"The word god is for me nothing more than the expression and product of human weaknesses, the Bible a collection of honourable, but still primitive legends which are nevertheless pretty childish. No interpretation no matter how subtle can (for me) change this."

Mayor información: The Guardian and The Guardian

sábado, mayo 10, 2008

Factores de transcripción bZIPs en plantas - Nube de etiquetas

Tenemos que un artículo sobre la familia de factores de transcripción bZIP, que acabamos de enviar a PLoS ONE, en segunda vuelta. (actualización: artículo publicado el 12.08.08)

Aquí está la nube de etiquetas para que se haganuna idea de que trata el artículo.

Factores de transcripción en Chlamydomonas

Siguiendo el ejemplo de Clastic Detritus y Green Gabbro, aquí va la nube de etiquetas (creada con TagCrowd) de uno de mis artículos recientes, que fue publicado en Genetics (Vol 179 No. 1, pp 31-39). Chlamydomonas es un alga verde, y el artículo trata de las familias de factores de transcripción es esta alga y otras plantas.

martes, marzo 25, 2008

Las cinco emociones de estar escribiendo la tesis

Corto y al punto:
Desesperanza, frustración, irritabilidad, alivio, robot.
Buena entrada en Green Gabbro

lunes, junio 04, 2007

Dinucleotide shuffle

Una de las estrategias comúnmente empleadas en el estudio de ARN no codificantes, es estimar la "energía mínima de plegamiento (MFE por sus siglas en inglés)" de la estructura secundaria del ARN candidato. Este enfoque se basa en el hecho de que en muchos ARN no codificantes la estructura secundaria de la molécula es importante para su desempeño en el sistema biológico.

Usualmente la MFE estimada se compara con la MFE de secuencias al azar derivadas por re-ordenamiento de la secuencia original de ARN ("nucleotide suffling"). La hipótesis subyacente es que ARN no codificantes funcionales tendrán una estructura secundaria más estable (con menor MFE) que la predicha para una secuencia al azar de la misma composición nucleótidica.

La hipótesis funcionaría bien si los programas de predicción de estructuras secundarias fuesen completamente independientes de los sesgos en el contenido se bases nucléotidicas en las secuencias. Desafortunadamente esto no ocurre. La predicción de estructuras secundarias se basa en observaciones experimentales de la energía libre de di-nucleótidos apilados, de forma que la composición de di-nucleótidos en la secuencia es un factor que tiene que ser controlado en el experimento computacional.

La forma de controlar por el efecto de la composición de di-nucleótidos es generando secuencias al azar en donde esta composición sea idéntica (de forma exacta o estadísticamente) a la de la secuencia original. De forma que si la MFE es realemente significativa, y no solo efecto del sesgo di-nucleótidico, esta será (estadísticamente) menor que la de la secuencia al azar.

La generación de secuencias al azar que conservan la composición de di-nucleótidos es un poco mas complicada que aquella en donde solo la composición de monómeros es preservada. En 1985 Altschul y Erickson desarrollaron un algoritmo para generar este tipo de secuencias aleatorias, del cual hay varias implementaciones. Una de ellas, en perl, esta disponible en MacResearch.

Así que no olvidar generar secuencias al azar que conserven la composición de di-nucleótidos cuando se analice la estabilidad de estructuras secundarias de ARN.

miércoles, marzo 21, 2007

OpenKapow

Conocí openkapow por un artículo en el blog de Pedro Beltrao, e inmediatamente decidí ensayarlo y ver que posibilidades brindaba.

Básicamente, openkapow sirve para reunir datos de diferentes sitios web en forma sistemática.

Yo tenía el siguiente poblema: necesitaba obtener la ubicacíon en el borrador del genoma de Chlamydomonas reinhardtii para cada uno de los factores de transcripción que aparecen en ChlamyTFDB.

La información sobre la ubicación en el genoma está en páginas web del JGI/DOE, y cada uno de los factores de transcripción en ChlamyTFDB tiene un hipervínculo a la página del JGI/DOE apropiada.

Claro, esta tarea se puede resolver usando, por ejemplo, scripts de PERL, pero eso significa una inversión significativa de tiempo, planenado, escribiendo y corrigiendo el script. Y aquí es donde openkapow nos ayuda.

Mediante una interface gráfica, Openkapow, permite construir paso a paso las acciones requeridas para navegar diferentes páginas, extraer datos usando el puntero del ratón y cliqueando, y exportar los datos a la web o archivos de texto locales en formato CSV, XML o HTML.

Creo que el único requisito para usar OpenKapow es poder estructurar el problema en forma programática, luego es aplicar la estructura en la interace de OpenKapow, incluso añadiendo control de errores, entrada de datos, y filtrado de resultados basado en expresiones regulares, si se desea.

En realidad me parece una excelente herramienta y se las recomiendo.

jueves, febrero 08, 2007

Propaganda PlnTFDB

Después de 4 meses de estar incapacitado, por un problema con mi pierna derecha, vuelvo a la universidad. Claro, esos 4 meses no fueron perdida completa. Salió un artículo presentando la base de datos de factores de transcripción en plantas (PlnTFDB: Plant Transcription Factor Database) que hemos creado.

Decidimos publicar el artíclo en BMC Bioinformatics, una revista de acceso abierto (Open Access, OA). Sobre el modelo de OA, solo ventajas. Primero, el artículo está disponible en internet para todo aquel que este interesado en leerlo, es posible redistribuirlo libremente, y crear trabajos derivados siempre y cuando la fuente original se referencie apropiadamente. En segundo lugar, el tiempo total desde que se envió el artículo por primera vez a la revista hasta que fue publicado en línea, fue de 47 días. Los comentarios y sugerencias de los evaluadores anónimos fueron en verdad de ayuda para mejorar la calidad del artículo y presentar un mensaje mas claro, y en algunos casos mejorar la base de datos en línea.

Lo que viene ahora es extender la base de datos, principalmente agregar datos experimentales sobre los factores de transcripción que hemos predicho.

miércoles, noviembre 29, 2006

First Online EMBL PhD Symposium

Del 4 al 8 de Diciembre se llevará a cabo el primer simposio en línea del EMBL. Completamente gratis y los interesador en proveer contenido, ofrecer charlas, presentar "posters" son libres de hacerlo previo registro. Yo me enteré via el blog the Pedro Beltrao.

Hay tres ejes principales de presentaciones y discusión:

Desarrollo de carreras en ciencias
Biología de sistemas / ómicas
Comunicación en ciencias 2.0

Adicionalmente abrá un "espacio" para que los diferentes participantes contribuyan con sus propias conferencias.

Sin lugar a dudas es un experimento interesante, realizar el encuentro en línea y completamente gratuito. Posiblemente sirva como un mecanismo adicional de popularización de la ciencia y de los retos y preguntas que siempre tenemos que abordar, así no sean propiamente científicos.

bueno, entocnes por "allá" nos vemos.