Parte de una serie sobre |
Biología evolucionaria |
---|
![]() |
Procesos y resultados |
Historia Natural |
Historia de la teoría evolutiva |
Campos y aplicaciones
|
Implicaciones sociales |
|
Un árbol filogenético (también filogenia o árbol evolutivo) es un diagrama de ramificación o un árbol que muestra las relaciones evolutivas entre varias especies biológicas u otras entidades basadas en similitudes y diferencias en sus características físicas o genéticas. Toda la vida en la Tierra es parte de un solo árbol filogenético, lo que indica un ancestro común.
En un árbol filogenético enraizado, cada nodo con descendientes representa el ancestro común inferido más reciente de esos descendientes, y las longitudes de los bordes en algunos árboles pueden interpretarse como estimaciones de tiempo. Cada nodo se llama unidad taxonómica. Los nodos internos generalmente se denominan unidades taxonómicas hipotéticas, ya que no pueden observarse directamente. Los árboles son útiles en campos de la biología como la bioinformática, la sistemática y la filogenia. Los árboles sin raíz ilustran solo la relación de los nodos de las hojas y no requieren que se conozca o se infiera la raíz ancestral.
La idea de un " árbol de la vida " surgió de las nociones antiguas de una progresión en forma de escalera desde las formas de vida inferiores a las superiores (como en la Gran Cadena del Ser ). Las primeras representaciones de árboles filogenéticos "ramificados" incluyen un "gráfico paleontológico" que muestra las relaciones geológicas entre plantas y animales en el libro Elementary Geology, de Edward Hitchcock (primera edición: 1840).
Charles Darwin (1859) también produjo una de las primeras ilustraciones y popularizó de manera crucial la noción de un "árbol" evolutivo en su libro seminal El origen de las especies. Más de un siglo después, los biólogos evolucionistas todavía usan diagramas de árbol para representar la evolución porque tales diagramas transmiten efectivamente el concepto de que la especiación ocurre a través de la división adaptativa y semi aleatoria de linajes. Con el tiempo, la clasificación de especies se ha vuelto menos estática y más dinámica.
El término filogenético, o filogenia, deriva de las dos palabras griegas antiguas φῦλον ( phûlon), que significa "raza, linaje", y γένεσις ( génesis), que significa "origen, fuente".
Un árbol filogenético enraizado (ver dos gráficos en la parte superior) es un árbol dirigido con un nodo único, la raíz, correspondiente al ancestro común más reciente (generalmente imputado ) de todas las entidades en las hojas del árbol. El nodo raíz no tiene un nodo padre, pero sirve como padre de todos los demás nodos del árbol. Por lo tanto, la raíz es un nodo de grado 2, mientras que otros nodos internos tienen un grado mínimo de 3 (donde "grado" aquí se refiere al número total de bordes entrantes y salientes).
El método más común para enraizar árboles es el uso de un grupo externo no controvertido, lo suficientemente cercano para permitir la inferencia a partir de datos de rasgos o secuenciación molecular, pero lo suficientemente lejos como para ser un grupo externo claro.
Los árboles sin raíces ilustran la relación de los nodos de las hojas sin hacer suposiciones sobre la ascendencia. No requieren que se conozca o se infiera la raíz ancestral. Los árboles sin raíces siempre se pueden generar a partir de árboles enraizados simplemente omitiendo la raíz. Por el contrario, inferir la raíz de un árbol sin raíz requiere algunos medios para identificar la ascendencia. Esto normalmente se hace incluyendo un grupo externo en los datos de entrada para que la raíz esté necesariamente entre el grupo externo y el resto de los taxones en el árbol, o introduciendo supuestos adicionales sobre las tasas relativas de evolución en cada rama, como una aplicación. de la hipótesis del reloj molecular.
Tanto los árboles enraizados como los no enraizados pueden ser bifurcados o multifurcados. Un árbol bifurcado con raíces tiene exactamente dos descendientes que surgen de cada nodo interior (es decir, forma un árbol binario ), y un árbol bifurcado sin raíces toma la forma de un árbol binario sin raíces, un árbol libre con exactamente tres vecinos en cada nodo interno. Por el contrario, un árbol multifurcado enraizado puede tener más de dos hijos en algunos nodos y un árbol multifurcado sin raíces puede tener más de tres vecinos en algunos nodos.
Tanto los árboles enraizados como los no enraizados se pueden etiquetar o no. Un árbol etiquetado tiene valores específicos asignados a sus hojas, mientras que un árbol sin etiquetar, a veces llamado forma de árbol, define solo una topología. Algunos árboles basados en secuencias construidos a partir de un pequeño locus genómico, como Phylotree, presentan nodos internos etiquetados con haplotipos ancestrales inferidos.
El número de árboles posibles para un número determinado de nodos de hojas depende del tipo específico de árbol, pero siempre hay más árboles etiquetados que no etiquetados, más multifurcantes que bifurcados y más enraizados que sin raíz. La última distinción es la más relevante desde el punto de vista biológico; surge porque hay muchos lugares en un árbol sin raíz para poner la raíz. Para bifurcar árboles etiquetados, el número total de árboles enraizados es:
Para bifurcar árboles etiquetados, el número total de árboles sin raíces es:
Entre los árboles bifurcados etiquetados, el número de árboles sin raíces con hojas es igual al número de árboles enraizados con hojas.
El número de árboles enraizados crece rápidamente en función del número de puntas. Para obtener 10 consejos, hay más árboles que se pueden bifurcar, y el número de árboles que se multifurcan aumenta más rápido, con ca. 7 veces más de estos últimos que de los primeros.
Hojas etiquetadas | Árboles binarios sin raíz | Árboles de raíces binarias | Árboles enraizados multifurcados | Todos los posibles árboles enraizados |
---|---|---|---|---|
1 | 1 | 1 | 0 | 1 |
2 | 1 | 1 | 0 | 1 |
3 | 1 | 3 | 1 | 4 |
4 | 3 | 15 | 11 | 26 |
5 | 15 | 105 | 131 | 236 |
6 | 105 | 945 | 1.807 | 2,752 |
7 | 945 | 10,395 | 28,813 | 39,208 |
8 | 10,395 | 135,135 | 524,897 | 660.032 |
9 | 135,135 | 2,027,025 | 10,791,887 | 12,818,912 |
10 | 2,027,025 | 34,459,425 | 247,678,399 | 282,137,824 |
Un dendrograma es un nombre general para un árbol, sea filogenético o no, y por lo tanto también para la representación esquemática de un árbol filogenético.
Un cladograma solo representa un patrón de ramificación; es decir, las longitudes de sus ramas no representan el tiempo o la cantidad relativa de cambio de carácter, y sus nodos internos no representan antepasados.
Un filograma es un árbol filogenético que tiene una longitud de rama proporcional a la cantidad de cambio de carácter.
Un cronograma es un árbol filogenético que representa explícitamente el tiempo a través de la longitud de sus ramas.
Un Dahlgrenograma es un diagrama que representa una sección transversal de un árbol filogenético.
Una red filogenética no es estrictamente un árbol, sino un gráfico más general, o un gráfico acíclico dirigido en el caso de redes enraizadas. Se utilizan para superar algunas de las limitaciones inherentes a los árboles.
Un diagrama de huso, o diagrama de burbujas, a menudo se denomina romerograma, después de su popularización por el paleontólogo estadounidense Alfred Romer. Representa la diversidad taxonómica (ancho horizontal) frente al tiempo geológico (eje vertical) para reflejar la variación de abundancia de varios taxones a través del tiempo. Sin embargo, un diagrama de huso no es un árbol evolutivo: los husos taxonómicos oscurecen las relaciones reales del taxón padre con el taxón hijo y tienen la desventaja de involucrar la parafilia del grupo parental. Este tipo de diagrama ya no se utiliza en la forma propuesta originalmente.
Darwin también mencionó que el coral puede ser una metáfora más adecuada que el árbol. De hecho, los corales filogenéticos son útiles para retratar la vida pasada y presente, y tienen algunas ventajas sobre los árboles (se permiten anastomosis, etc.).
Los árboles filogenéticos compuestos con un número considerable de secuencias de entrada se construyen utilizando métodos filogenéticos computacionales. Los métodos de matriz de distancia como la unión de vecinos o UPGMA, que calculan la distancia genética a partir de múltiples alineamientos de secuencia, son los más sencillos de implementar, pero no invocan un modelo evolutivo. Muchos métodos de alineación de secuencias, como ClustalW, también crean árboles mediante el uso de algoritmos más simples (es decir, los basados en la distancia) de la construcción de árboles. La parsimonia máxima es otro método simple de estimar árboles filogenéticos, pero implica un modelo implícito de evolución (es decir, parsimonia). Los métodos más avanzados utilizan el criterio de optimalidad de máxima verosimilitud, a menudo dentro de un marco bayesiano, y aplican un modelo explícito de evolución a la estimación de árboles filogenéticos. Identificar el árbol óptimo usando muchas de estas técnicas es NP-difícil, por lo que los métodos heurísticos de búsqueda y optimización se usan en combinación con funciones de puntuación de árboles para identificar un árbol razonablemente bueno que se ajuste a los datos.
Los métodos de construcción de árboles se pueden evaluar sobre la base de varios criterios:
Las técnicas de construcción de árboles también han llamado la atención de los matemáticos. Los árboles también pueden ser construidos usando T-teoría.
Los árboles se pueden codificar en varios formatos diferentes, todos los cuales deben representar la estructura anidada de un árbol. Pueden codificar o no las longitudes de las ramas y otras características. Los formatos estandarizados son fundamentales para distribuir y compartir árboles sin depender de la salida de gráficos que es difícil de importar al software existente. Los formatos más utilizados son
Aunque los árboles filogenéticos producidos sobre la base de genes secuenciados o datos genómicos en diferentes especies pueden proporcionar información evolutiva, estos análisis tienen limitaciones importantes. Lo más importante es que los árboles que generan no son necesariamente correctos; no necesariamente representan con precisión la historia evolutiva de los taxones incluidos. Como ocurre con cualquier resultado científico, están sujetos a falsificación mediante estudios adicionales (por ejemplo, recopilación de datos adicionales, análisis de los datos existentes con métodos mejorados). Los datos en los que se basan pueden ser ruidosos ; el análisis puede confundirse por recombinación genética, transferencia horizontal de genes, hibridación entre especies que no eran vecinas más cercanas en el árbol antes de que se produzca la hibridación, evolución convergente y secuencias conservadas.
Además, existen problemas para basar un análisis en un solo tipo de carácter, como un solo gen o proteína o solo en el análisis morfológico, porque tales árboles construidos a partir de otra fuente de datos no relacionada a menudo difieren de la primera y, por lo tanto, se necesita mucho cuidado. en inferir relaciones filogenéticas entre especies. Esto es más cierto para el material genético que está sujeto a transferencia lateral de genes y recombinación, donde diferentes bloques de haplotipos pueden tener diferentes historias. En estos tipos de análisis, el árbol de salida de un análisis filogenético de un solo gen es una estimación de la filogenia del gen (es decir, un árbol de genes) y no la filogenia de los taxones (es decir, el árbol de especies) de los que se tomaron muestras de estos caracteres, aunque idealmente, ambos deberían estar muy cerca. Por esta razón, los estudios filogenéticos serios generalmente usan una combinación de genes que provienen de diferentes fuentes genómicas (por ejemplo, de genomas mitocondriales o plástidos frente a genomas nucleares), o genes que se esperaría que evolucionen bajo diferentes regímenes selectivos, de modo que la homoplasia (falso homología ) es poco probable que resulte de la selección natural.
Cuando se incluyen especies extintas como nodos terminales en un análisis (en lugar de, por ejemplo, restringir los nodos internos), se considera que no representan antepasados directos de ninguna especie existente. Las especies extintas no suelen contener ADN de alta calidad.
La gama de materiales de ADN útiles se ha ampliado con los avances en las tecnologías de extracción y secuenciación. El desarrollo de tecnologías capaces de inferir secuencias a partir de fragmentos más pequeños o de patrones espaciales de productos de degradación del ADN ampliaría aún más la gama de ADN que se considera útil.
Los árboles filogenéticos también se pueden inferir a partir de una variedad de otros tipos de datos, incluida la morfología, la presencia o ausencia de tipos particulares de genes, eventos de inserción y deleción, y cualquier otra observación que se considere que contiene una señal evolutiva.
Las redes filogenéticas se utilizan cuando la bifurcación de árboles no es adecuada, debido a estas complicaciones que sugieren una historia evolutiva más reticulada de los organismos muestreados.
![]() | Wikimedia Commons tiene medios relacionados con árboles filogenéticos. |