El término Bioinformática puede
definirse como la aplicación de técnicas informáticas y ciencias de la
computación, aplicados a problemas biológicos de las ciencias naturales. El
origen griego de Bio significa “Vida”, no es una palabra castellana y se
utiliza en palabras compuestas, y el término Informática proviene del francés
Informatique, propuesta por el ingeniero Philippe Dreyfus a comienzos de la
década del ‘60 para referirse al
procesamiento automático de información mediante dispositivos electrónicos y
sistemas computacionales (Luscombe, Greenbaum, & Gerstein, 2001). Somos ingenieros informáticos y magister en Bioinformática y Biologia Computacional y disponemos de un Servidor para hacer los análisis respectivos en cuanto temas de genómica y metagenómica.
Solicita tu cita al whatsapp

Genoma
Se denomina genoma al conjunto de todos
los genes que constituyen las moléculas de ADN contenidas en el total de
cromosomas que caracterizan a una especie biológica. Todos los seres vivos
disponen de un código genético, el cual es el conjunto instrucciones únicas,
codificada en el material genético (ADN o ARN), el cual se traduce en proteínas
en las células vivas.
Programas ensambladores
MaSuRCA: Es un programa bioinformático para el ensamblado de
genomas completo. Combina los beneficios del gráfico deBruijn y los enfoques de
montaje Overlap-Layout-Consensus (OLC). Tiene la posibilidad de ser
parametrizable para el ensamblaje de microorganismos eucariotas y procariotas,
trabaja con datos secuenciados con equipos de tecnología Ilumina, Sanger, 454,
Pacbio y Nanopore, y puede ensamblar mezclas de lecturas cortas y largas (Zimin
et al., 2013).
VelvetoOptimizer: Este programa está diseñado para
ejecutarse como un script para el ensamblador de Velvet, busca un rango de
valores óptimo, calcula la cobertura esperada. Encuentra automáticamente los
ajustes de parámetros óptimos para Velvet (Manual & Zerbino, 2008).
Velvet: Este programa ensamblador tiene dos script, Velveth
y Velvetg. El subprograma Velveth es el encargado de ayudar a formar la
estructura de datos o conjunto de datos (Roadmaps), e incluye información sobre
el significado de cada archivo de secuencia que se van a utilizar para
ensamblar todo el conjunto del genoma. El subprograma Velvetg, es el
encargado de construir el gráfico de Bruijn a partir de los Kmer obtenidos por
Velveth, y manipularlo para conseguir ensamblar las lecturas que hemos pasado
por parámetro (Zerbino, 2010).
SOAPdenovo: Es un novedoso método de ensamblaje de lecturas
cortas que puede construir un ensamblaje de novo para los genomas de tamaño
humano. Está diseñado para ensamblar lecturas cortas de Illumina y lleva a cabo
análisis precisos de genomas inexplorados de una manera confiable. Su algoritmo
que reduce el consumo de memoria, resuelve más regiones repetidas en ensambles
contig, aumenta la cobertura y la longitud en la construcción de scafolds,
mejora el cierre de gaps y optimiza genomas grandes (Luo et al., 2012).
AbySS: Es un ensamblador de novo, diseñado para lecturas
cortas. Este algoritmo genera dos procesos. El primero genera todas las
subcadenas de secuencias de longitud Kmers específica y el segundo utiliza los
pares para extender los contigs resolviendo ambigüedades en las superposiciones
de los contig (Simpson et al., 2009).
MUMMER: Es un sistema de software bioinformático para la
alineación de secuencias. Se basa en la estructura de datos del árbol de
sufijos y es uno de los sistemas más rápidos y eficientes disponibles para esta
tarea, lo que permite su aplicación a secuencias muy largas (Delcher, Salzberg,
& Phillippy, 2003).
QUAST-(Quality Assessment Tool for Genome Assemblies): es
una herramienta bioinformática que se utiliza para evaluar la calidad de los
ensamblajes del genoma mediante el cálculo de varias métricas (Gurevich,
Saveliev, Vyahhi, & Tesler, 2013).
Técnicas de anotación
Anotar el genoma es predecir sus genes,
es inferir información estructural o funcional de los genes o proteínas. Una
vez se tiene la secuencia de un genoma, el paso siguiente es conocer qué se
tiene escrito, por lo tanto se buscan secuencias que codifiquen proteínas. Aquí
se involucran soluciones bioinformáticas para la predicción de secuencias
génicas, que usan modelos génicos de organismos conocidos (González et al.,
2017).
Normalmente el proceso de anotación de
un gen pasa por ubicar las regiones de interés, hallando las secuencias
codificantes del gen (CDS), luego se alinean con la región las predicciones
genéticas, creando un modelo del gen, que en su mayoría requieren edición y
ajuste, para luego verificar la exactitud de la anotación resultante con los
homólogos (Lee et al., 2013).
Software para la anotación Funcional
Interproscan-5.31-70.0
Es un programa bioinformático que
realiza la anotación funcional de proteínas clasificándolas en familias y
prediciendo dominios. Las secuencias de proteínas en las bases de datos de los
miembros de Interpro utilizando una variedad de métodos basados en el perfil,
de Markov oculto y de matriz de puntuación específica de posición. No solo
combina un conjunto de herramientas de análisis, sino que también realiza una
búsqueda de datos de varias fuentes, así como también una eliminación de
redundancia (Jones et al., 2014). La visualización de los datos se puede
realizar a través del IPRStats (Kelly, Vincent, & Friedberg, 2010).
Wego.genomics
Es una herramienta simple pero útil para
visualizar, comparar y trazar resultados de anotaciones GO (Ontología de genes)
(Ye et al., 2006).
Software para la anotación estructural
Prokka V.1.12
Es una herramienta de software de línea
de comandos bajo sistema Unix, coordina una suite de herramientas de software
existentes para lograr una anotación rica y confiable de secuencias bacterianas
genómicas (Seemann, 2014).
Pangenoma
Es un concepto definido para entender la
complejidad genética, dado que en cualquier secuencia de ADN que se analiza, se
encuentran nuevos genes significativos. El pangenoma es el sistema genético
común de todos los seres vivos, sus moléculas orgánicas y sus contenidos genéticos
implicados en el almacenamiento y la transmisión de los procesos de la
información genética (Tetz, 2005). Sus inicios datan del año 2005 por Medini.
La función del pangenoma está en encontrar la variación entre individuos y
especies, permitiendo obtener mayor información para lograr un mayor grado de
exactitud a la clasificación de la especie en estudio. Inicialmente el concepto
de especie tenía explicación principalmente fenotípica, el cual se determinó en
base al grado de semejanza entre microorganismos; sin embargo, al tener en cuenta el fenotipo y la secuencia
del gen que codifica el rRNA 16S, se pueden establecer los genes más
conservados en la especie. El análisis de estos grupos de genes, accesorios, únicos
y del core, supone una clasificación más real de la especie; ya que presenta su
clasificación tanto estructural como funcional de genoma.
Get-homologous
Es un programa que permite la agrupación
de secuencias de proteínas y nucleótidos en grupos homólogos (posiblemente
ortólogos) utilizando los algoritmos de agrupamiento bidireccionales,
COGtriangles o OrthoMCL, sobre la base de la similitud de secuencias.
Igualmente permite la identificación de grupos ortólogos de regiones
intergénicas, flanqueados por marcos de lectura abiertos (ORF) ortólogos,
conservados en genomas relacionados (Contreras-Moreira & Vinuesa, 2013).
BLAST es un programa informático de
alineamiento de secuencias de tipo local, ya sea de ADN, ARN o de proteínas. El
programa es capaz de comparar una secuencia problema contra una gran cantidad
de secuencias que se encuentren en una base de datos (McGinnis & Madden,
2004)
Pfam
Es una amplia colección de alineamientos
múltiples de secuencias y modelos ocultos de Markov que cubre buena parte de
dominios proteicos y familias comunes y sirve para buscar los dominios
conservados (El-Gebali et al., 2018).
Diseño de códigos de barra genéticos (primers)
ePCR
Es una herramienta de la NCBI que
permite hacer las pruebas in Silico de los primer diseñados. Ppermite buscar en
una base de datos de secuencias seleccionadas STS, dentro de una secuencia de
nucleótidos, el microorganismo o grupo de microorganismos y sus posiciones en
el primers (“NCBI News: Spring 2004|e-PCR and Reverse e-PCR,” n.d.).