Contenido más reciente ...

30 de abril de 2009

Cladistics: Analisis de una matriz gigante de >73000 UT

ResearchBlogging.orgEsto si que es difícil de creer: el análisis cladístico de una matriz "super gigante" de 73060 entidades. Así es, no es error de dedo, más de 73 mil unidades terminales! Este análisis portentoso fue efectuado por un equipo basado en Tucumán (Argentina) liderado por Pablo Goloboff. La referencia del artículo, por ahora solo disponible en linea, es:
Phylogenetic analysis of 73 060 taxa corroborates major eukaryotic groups
Pablo A. Goloboff, Santiago A. Catalano, J. Marcos Mirande, Claudia A. Szumik, J. Salvador Arias, Mari Källersjö and James S. Farris.
Cladistics
http://dx.doi.org/10.1111/j.1096-0031.2009.00255.x

ABSTRACT
Obtaining a well supported schema of phylogenetic relationships among the major groups of living organisms requires considering as much taxonomic diversity as possible, but the computational cost of calculating large phylogenies has so far been a major obstacle. We show here that the parsimony algorithms implemented in TNT can successfully process the largest phylogenetic data set ever analysed, consisting of molecular sequences and morphology for 73 060 eukaryotic taxa. The trees resulting from molecules alone display a high degree of congruence with the major taxonomic groups, with a small proportion of misplaced species; the combined data set retrieves these groups with even higher congruence. This shows that tree-calculation algorithms effectively retrieve phylogenetic history for very large data sets, and at the same time provides strong corroboration for the major eukaryotic lineages long recognized by taxonomists.
Antes de este logro, la idea de matriz "grande" andaba en los 500-1000 unidades terminales (Uts), y los más ambiciosos se esforzaban por ensamblar y analizar matrices de 1500 a 2000 unidades. Obviamente las dificultades para realizar análisis filogenéticos crecen desmesuradamente con cada unidad agregada a la matriz. Los intentos de exploración del enorme espacio de los arboles con estrategias y software convencional (como PAUP) no permitían ni siquiera ver la posibilidad de intentar el análisis de matrices gigantes. Entonces, Goloboff et al (2009) como lo lograron?
Ademas del trabajo tenaz y laborioso que implica compilar una matriz con tantas unidades terminales y caracteres moleculares y morfológicos, la clave del éxito fueron las capacidades analíticas de este grupo de investigadores usando el software TNT.

Bye bye Super-Trees, bienvenidas las SUPER-MATRICES!!!
-
Goloboff, P., Catalano, S., Marcos Mirande, J., Szumik, C., Salvador Arias, J., Källersjö, M., & Farris, J. (2009). Phylogenetic analysis of 73 060 taxa corroborates major eukaryotic groups Cladistics DOI: 10.1111/j.1096-0031.2009.00255.x
-

1 comentario:

  1. No solo esto es un golpe de muerte a la misma idea de los superarboles. Otras cosas que me gusta resaltar es que también falsea la idea de que con las secuencias hoy por hoy “tenemos muchos datos pero no tenemos como analizarlos”.

    Y que aún a esta escala, los datos morfológicos siguen siendo son valiosos :)

    ResponderEliminar

Archivo del Blog

Notificación de contenido nuevo

Ingrese su correo electrónico:

Reciba las noticias en su correo electrónico mediante FeedBurner

Reciba las noticias de Filogenetica.org en:

Follow Filogeneticaorg on Twitter
Siguenos en Facebook

-


Seguidores

Comenta en Facebook

Lo más reciente en el blog de Morfometría Geométrica