La exploración de la biodiversidad, la clasificación filogenética y la identificación de muestras son las tres tareas fundamentales de
la sistemática. Los obstáculos y dificultades en cada área son diversos, pero como biólogos todos sabemos lo difícil que es identificar taxonómicamente una colección de muestras, sean de plantas, animales, hongos, etc. Ademas de la muestra en buen estado y claves de identificación, frecuentemente se necesita el "ojo experto" del taxónomo especialista.
De identificadores morfológicos a identificadores molecularesLa disponibilidad de marcadores moleculares en la forma de secuencias cortas y muy especificas o restringidas a una especie permiten ahora la identificación rápida de muestras biológicas, sin claves de identificación morfológicas y sin la necesidad del taxónomo experto. Los "códigos de barras de DNA" son simplemente eso, marcadores moleculares cuya presencia permite identificar una especie.
Como sucede con cualquier atributo identificador (morfológico o molecular) los códigos de DNA fallan si la muestra pertenece a una especie que no ha sido previamente descrita y clasificada. Entonces antes de conseguir el "código genético" o DNA barcoding de la biota, los taxónomos deben explorar, descubrir, describir y clasificar las especies. Aun si el trabajo de clasificar ya esta hecho, las muestras de referencia para extraer el DNA deben estar bien identificadas, por el taxónomo experto. Ademas, el marcador molecular debe ser bien identificado tambien y exclusivo o tener poca variación intraespecífica y geográfica para asegurar un porcentaje alto de identificaciones correctas de otras muestras futuras de la especie en cuestión. Un resumen reciente y excelente de la teoría y métodos de los códigos de DNA es el de Meir (2008, cap 7, en: Wheeler, QD, ed, The new taxonomy. Syst. Assoc. vol 76. CRC press).
Que tan exclusiva a una especie es la presencia de cierta variante del marcador molecular? Que tanta variación y repetibilidad se conoce de esa secuencia de DNA? Realmente son buenos identificadores? Las respuestas van desde el optimismo exagerado o ingenuo hasta el escepticismo total. Los pros y cons del DNA barcoding se han debatido en la literatura (Lipscomb et al 2003, TREE 18: 65-66; Mallet & Wilmott 2003, TREE 10:57-59; Tautz et al, 2002, Nature 418: 479; 2003, TREE 18: 7074; Seberg et al 2003, TREE 18: 63-65). Lo que es un hecho es que siguen surgiendo cada vez mas los
ejemplos de casos de especies que sugieren moderar las expectativas del potencial real de los identificadores moleculares
(Song et al 2008).El ejemplo más reciente es un artículo (Buhay 2009) que revela la importancia de identificar con precisión las secuencias del marcador usado para el "codigo de DNA". El caso es el de secuencias que se obtuvieron y catalogaron como COI (cytochrome c oxidase subunit I) pero ahora un analisis cuidadoso reveló que eso fue un error muy serio, pues las secuencias realmente son de pseudogenes no codificantes (COI-like numts, nuclear copies of mitochondrial derived genes).
Comparación de dos secuencias COI fidedignas y de una secuencia mal identificada como COI. Click para ver la imagen a 1379px × 152px Los errores de identificación ocurren donde sea: usando las clásicas claves morfológicas y también con los "codigos de barras de DNA". El problema es que ante diferentes resultados en la identificación, comúnmente se cuestiona el procedimiento morfológico pero no el resultado molecular. Este estudio minimamente debe alertar a todos pues los errores de identificación de las secuencias son mas comunes de lo que se desea aceptar. No todo lo que brilla es oro!
Referencia del articulo:
Buhay, J. (2009). “COI-like” Sequences are Becoming Problematic in Molecular Systematic and DNA Barcoding Studies Journal of Crustacean Biology, 29 (1), 96-110 DOI: 10.1651/08-3020.1
A B S T R A C T
The cytochrome c oxidase subunit I (COI) gene plays a pivotal role in a global effort to document biodiversity and continues to be a gene of choice in phylogenetic and phylogeographic studies. Due to increased attention on this gene as a species’ barcode, quality control and sequence homology issues are re-emerging. Taylor and Knouft (2006) attempted to examine gonopod morphology in light of the subgeneric classification scheme within the freshwater crayfish genus Orconectes using COI sequences. However, their erroneous analyses were not only based on supposed mitochondrial sequences but also incorporated many questionable sequences due to the possible presence of numts and manual editing or sequencing errors. In fact, 22 of the 86 sequences were flagged as ‘‘COI-like’’ by GenBank due to the presence of stop codons and indels in what should be the open reading frame of a conservative protein-coding gene. A subsequent search of ‘‘COI-like’’ accessions in GenBank turned up a multitude of taxa across Crustacea from published and unpublished studies thereby warranting this illustrated discussion about quality control, pseudogenes, and sequence composition.
KEY WORDS: cytochrome c oxidase subunit I,molecular taxonomy, numt, protein-coding gene, pseudogene
DOI: 10.1651/08-3020.1