Phylogenetic analysis of 73 060 taxa corroborates major eukaryotic groupsAntes de este logro, la idea de matriz "grande" andaba en los 500-1000 unidades terminales (Uts), y los más ambiciosos se esforzaban por ensamblar y analizar matrices de 1500 a 2000 unidades. Obviamente las dificultades para realizar análisis filogenéticos crecen desmesuradamente con cada unidad agregada a la matriz. Los intentos de exploración del enorme espacio de los arboles con estrategias y software convencional (como PAUP) no permitían ni siquiera ver la posibilidad de intentar el análisis de matrices gigantes. Entonces, Goloboff et al (2009) como lo lograron?
Pablo A. Goloboff, Santiago A. Catalano, J. Marcos Mirande, Claudia A. Szumik, J. Salvador Arias, Mari Källersjö and James S. Farris.
Cladistics
http://dx.doi.org/10.1111/j.1096-0031.2009.00255.x
ABSTRACT
Obtaining a well supported schema of phylogenetic relationships among the major groups of living organisms requires considering as much taxonomic diversity as possible, but the computational cost of calculating large phylogenies has so far been a major obstacle. We show here that the parsimony algorithms implemented in TNT can successfully process the largest phylogenetic data set ever analysed, consisting of molecular sequences and morphology for 73 060 eukaryotic taxa. The trees resulting from molecules alone display a high degree of congruence with the major taxonomic groups, with a small proportion of misplaced species; the combined data set retrieves these groups with even higher congruence. This shows that tree-calculation algorithms effectively retrieve phylogenetic history for very large data sets, and at the same time provides strong corroboration for the major eukaryotic lineages long recognized by taxonomists.
Ademas del trabajo tenaz y laborioso que implica compilar una matriz con tantas unidades terminales y caracteres moleculares y morfológicos, la clave del éxito fueron las capacidades analíticas de este grupo de investigadores usando el software TNT.
Bye bye Super-Trees, bienvenidas las SUPER-MATRICES!!!
-
Goloboff, P., Catalano, S., Marcos Mirande, J., Szumik, C., Salvador Arias, J., Källersjö, M., & Farris, J. (2009). Phylogenetic analysis of 73 060 taxa corroborates major eukaryotic groups Cladistics DOI: 10.1111/j.1096-0031.2009.00255.x
-
No solo esto es un golpe de muerte a la misma idea de los superarboles. Otras cosas que me gusta resaltar es que también falsea la idea de que con las secuencias hoy por hoy “tenemos muchos datos pero no tenemos como analizarlos”.
ResponderEliminarY que aún a esta escala, los datos morfológicos siguen siendo son valiosos :)