Reconstrucción de Árboles Filogenéticos
- Created by: ModeMat
- Current state: Ejecución
- Colaboration: EPN-PUCE
El presente proyecto involucra el trabajo de un equipo interdisciplinario de investigadores del Centro de Modelización Matemática (MODEMAT), del Instituto de Biología de la EPN y del Departamento de Biología de la Universidad Católica del Ecuador (PUCE), Su objetivo es desarrollar algoritmos para la reconstrucción de árboles filogenéticos, implementarlos computacionalmente, y evaluar su rendimiento.
La investigación de la evolución es un campo multidisciplinario que ha experimentado un notable desarrollo durante las últimas tres décadas, y que involucra principalmente a la biología, las matemáticas, la estadística y las ciencias de la computación. Uno de los grandes objetivos perseguidos en este contexto es la inferencia de los procesos de evolución de los organismos a partir de patrones observables en su ADN. Por ejemplo, conocidos segmentos de la secuencia de ADN para determinadas especies, se busca reconstruir su historia evolutiva y entender los procesos que la gobiernan. La historia evolutiva suele expresarse mediante un árbol filogenético, que revela las relaciones de parentesco entre las especies. La tarea de reconstrucción de árboles filogenéticos es compleja, debido a la gran cantidad de datos a procesar y a la enorme potencia de cálculo requerida.
El desarrollo de nuevos algoritmos para la reconstrucción de árboles filogenéticos, así como su implementación computacional eficiente (a través de técnicas como la paralelización) es un foco activo de investigación en la actualidad. Varias implementaciones están disponibles a través de portales públicos de Internet. Entre ellos, cabe mencionar al Cyberstructure for Phylogenetic Research – CIPRES, que permite el acceso a los recursos computacionales de la red XSEDE, los mismos que incluyen a 16 supercomputadores localizados en diferentes laboratorios y centros de investigación en los Estados Unidos de América.
En este proyecto nos proponemos estudiar el comportamiento de diferentes algoritmos para la reconstrucción de árboles filogenéticos, al aplicarlos sobre datos correspondientes a algunos grupos de especies estudiadas por investigadores del Instituto de Biología de la EPN y del Departamento de Biología de la PUCE. En base a sus observaciones, desarrollaremos en el Centro de Modelización Matemática (ModeMat) nuevos métodos que permitan obtener mejores filogenias y optimizar el uso de los recursos computacionales disponibles. Crearemos un repositorio con las herramientas informáticas desarrolladas, así como aquellas libremente disponibles por parte de otros autores, para facilitar su acceso local por parte de los investigadores. Este repositorio podría eventualmente servir como punto de partida para la creación, en el marco de un proyecto posterior de mayor alcance, de un portal web para análisis filogenéticos a nivel de la región andina.