ANÁLISIS BIOINFORMÁTICOS

El término Bioinformática puede definirse como la aplicación de técnicas informáticas y ciencias de la computación, aplicados a problemas biológicos de las ciencias naturales. El origen griego de Bio significa “Vida”, no es una palabra castellana y se utiliza en palabras compuestas, y el término Informática proviene del francés Informatique, propuesta por el ingeniero Philippe Dreyfus a comienzos de la década del ‘60 para referirse al procesamiento automático de información mediante dispositivos electrónicos y sistemas computacionales (Luscombe, Greenbaum, & Gerstein, 2001). Somos ingenieros informáticos y magister en Bioinformática y Biologia Computacional y disponemos de un Servidor para hacer los análisis respectivos en cuanto temas de genómica y metagenómica.

Solicita tu cita al whatsapp

Genoma

Se denomina genoma al conjunto de todos los genes que constituyen las moléculas de ADN contenidas en el total de cromosomas que caracterizan a una especie biológica. Todos los seres vivos disponen de un código genético, el cual es el conjunto instrucciones únicas, codificada en el material genético (ADN o ARN), el cual se traduce en proteínas en las células vivas.

Programas ensambladores

MaSuRCA: Es un programa bioinformático para el ensamblado de genomas completo. Combina los beneficios del gráfico deBruijn y los enfoques de montaje Overlap-Layout-Consensus (OLC). Tiene la posibilidad de ser parametrizable para el ensamblaje de microorganismos eucariotas y procariotas, trabaja con datos secuenciados con equipos de tecnología Ilumina, Sanger, 454, Pacbio y Nanopore, y puede ensamblar mezclas de lecturas cortas y largas (Zimin et al., 2013).

VelvetoOptimizer: Este programa está diseñado para ejecutarse como un script para el ensamblador de Velvet, busca un rango de valores óptimo, calcula la cobertura esperada. Encuentra automáticamente los ajustes de parámetros óptimos para Velvet (Manual & Zerbino, 2008).

Velvet: Este programa ensamblador tiene dos script, Velveth y Velvetg. El subprograma Velveth es el encargado de ayudar a formar la estructura de datos o conjunto de datos (Roadmaps), e incluye información sobre el significado de cada archivo de secuencia que se van a utilizar para ensamblar todo el conjunto del genoma. El subprograma Velvetg, es el encargado de construir el gráfico de Bruijn a partir de los Kmer obtenidos por Velveth, y manipularlo para conseguir ensamblar las lecturas que hemos pasado por parámetro (Zerbino, 2010).

SOAPdenovo: Es un novedoso método de ensamblaje de lecturas cortas que puede construir un ensamblaje de novo para los genomas de tamaño humano. Está diseñado para ensamblar lecturas cortas de Illumina y lleva a cabo análisis precisos de genomas inexplorados de una manera confiable. Su algoritmo que reduce el consumo de memoria, resuelve más regiones repetidas en ensambles contig, aumenta la cobertura y la longitud en la construcción de scafolds, mejora el cierre de gaps y optimiza genomas grandes (Luo et al., 2012).

AbySS: Es un ensamblador de novo, diseñado para lecturas cortas. Este algoritmo genera dos procesos. El primero genera todas las subcadenas de secuencias de longitud Kmers específica y el segundo utiliza los pares para extender los contigs resolviendo ambigüedades en las superposiciones de los contig (Simpson et al., 2009).

MUMMER: Es un sistema de software bioinformático para la alineación de secuencias. Se basa en la estructura de datos del árbol de sufijos y es uno de los sistemas más rápidos y eficientes disponibles para esta tarea, lo que permite su aplicación a secuencias muy largas (Delcher, Salzberg, & Phillippy, 2003).

QUAST-(Quality Assessment Tool for Genome Assemblies): es una herramienta bioinformática que se utiliza para evaluar la calidad de los ensamblajes del genoma mediante el cálculo de varias métricas (Gurevich, Saveliev, Vyahhi, & Tesler, 2013).

Técnicas de anotación

Anotar el genoma es predecir sus genes, es inferir información estructural o funcional de los genes o proteínas. Una vez se tiene la secuencia de un genoma, el paso siguiente es conocer qué se tiene escrito, por lo tanto se buscan secuencias que codifiquen proteínas. Aquí se involucran soluciones bioinformáticas para la predicción de secuencias génicas, que usan modelos génicos de organismos conocidos (González et al., 2017).

Normalmente el proceso de anotación de un gen pasa por ubicar las regiones de interés, hallando las secuencias codificantes del gen (CDS), luego se alinean con la región las predicciones genéticas, creando un modelo del gen, que en su mayoría requieren edición y ajuste, para luego verificar la exactitud de la anotación resultante con los homólogos (Lee et al., 2013).

Software para la anotación Funcional

Interproscan-5.31-70.0

Es un programa bioinformático que realiza la anotación funcional de proteínas clasificándolas en familias y prediciendo dominios. Las secuencias de proteínas en las bases de datos de los miembros de Interpro utilizando una variedad de métodos basados en el perfil, de Markov oculto y de matriz de puntuación específica de posición. No solo combina un conjunto de herramientas de análisis, sino que también realiza una búsqueda de datos de varias fuentes, así como también una eliminación de redundancia (Jones et al., 2014). La visualización de los datos se puede realizar a través del IPRStats (Kelly, Vincent, & Friedberg, 2010).

Wego.genomics

Es una herramienta simple pero útil para visualizar, comparar y trazar resultados de anotaciones GO (Ontología de genes) (Ye et al., 2006).

Software para la anotación estructural

Prokka V.1.12

Es una herramienta de software de línea de comandos bajo sistema Unix, coordina una suite de herramientas de software existentes para lograr una anotación rica y confiable de secuencias bacterianas genómicas (Seemann, 2014).

Pangenoma

Es un concepto definido para entender la complejidad genética, dado que en cualquier secuencia de ADN que se analiza, se encuentran nuevos genes significativos. El pangenoma es el sistema genético común de todos los seres vivos, sus moléculas orgánicas y sus contenidos genéticos implicados en el almacenamiento y la transmisión de los procesos de la información genética (Tetz, 2005). Sus inicios datan del año 2005 por Medini. La función del pangenoma está en encontrar la variación entre individuos y especies, permitiendo obtener mayor información para lograr un mayor grado de exactitud a la clasificación de la especie en estudio. Inicialmente el concepto de especie tenía explicación principalmente fenotípica, el cual se determinó en base al grado de semejanza entre microorganismos; sin embargo, al tener en cuenta el fenotipo y la secuencia del gen que codifica el rRNA 16S, se pueden establecer los genes más conservados en la especie. El análisis de estos grupos de genes, accesorios, únicos y del core, supone una clasificación más real de la especie; ya que presenta su clasificación tanto estructural como funcional de genoma.

Get-homologous

Es un programa que permite la agrupación de secuencias de proteínas y nucleótidos en grupos homólogos (posiblemente ortólogos) utilizando los algoritmos de agrupamiento bidireccionales, COGtriangles o OrthoMCL, sobre la base de la similitud de secuencias. Igualmente permite la identificación de grupos ortólogos de regiones intergénicas, flanqueados por marcos de lectura abiertos (ORF) ortólogos, conservados en genomas relacionados (Contreras-Moreira & Vinuesa, 2013).

BLAST

BLAST es un programa informático de alineamiento de secuencias de tipo local, ya sea de ADN, ARN o de proteínas. El programa es capaz de comparar una secuencia problema contra una gran cantidad de secuencias que se encuentren en una base de datos (McGinnis & Madden, 2004)

Pfam

Es una amplia colección de alineamientos múltiples de secuencias y modelos ocultos de Markov que cubre buena parte de dominios proteicos y familias comunes y sirve para buscar los dominios conservados (El-Gebali et al., 2018).

Diseño de códigos de barra genéticos (primers)

ePCR

Es una herramienta de la NCBI que permite hacer las pruebas in Silico de los primer diseñados. Ppermite buscar en una base de datos de secuencias seleccionadas STS, dentro de una secuencia de nucleótidos, el microorganismo o grupo de microorganismos y sus posiciones en el primers (“NCBI News: Spring 2004|e-PCR and Reverse e-PCR,” n.d.).

Las empresas que desarrollan bioinsumos, generalmente evalúan en campo la respuesta fisiológica de la planta con la cual se comprueba el uso potencial del producto Biológico; adicionalmente se realizan aislamientos de los microorganismos para comprobar su persistencia en el suelo, pero no siempre se obtienen las respuestas esperadas, debido a interferencia de la biota acompañante. Para garantizar la calidad de los productos desarrollados surgen las necesidades de ampliar la información relacionada con la formulación, a través de una caracterización genómica de los microorganismos que hacen parte del mismo, y del desarrollo de una técnica que posibilite la evaluación y seguimiento en campo de los microorganismos formulados en los productos. Se necesita contar con métodos más específicos, que faciliten el proceso de caracterización y determinación de la trazabilidad de los microorganismos presentes en el producto biológico, al igual que el desarrollo de un flujo de trabajo que permita la identificación de cepas luego de su aplicación en el suelo.

Este proceso aunque necesario es demasiado costoso dado el proceso de secuenciación, los análisis bioinformáticos y el alto rendimiento computacional requerido; sin embargo existen opciones que de acuerdo al tamaño del mismo se puede realizar con el secuenciador MinION, el cual es un equipo que permite la secuenciación directa de ADN / ARN, análisis en tiempo real, lecturas ultra largas - hasta 2 Mb, escalable a portátil o de escritorio, preparación sencilla y rápida, o automatizada, de la biblioteca, y altos rendimientos para genomas grandes.

https://nanoporetech.com/

Entre sus múltiples aplicaciones destaca la posibilidad de utilizarlo fuera del laboratorio, permitiendo, por ejemplo, el análisis de una muestra criminal en el mismo lugar del crimen, por parte de la policía científica.

https://nanoporetech.com/

El Minion es un dispositivo portátil de 90 g. En su núcleo se encuentra una celda de flujo que soporta hasta 2048 nanoporos direccionables individualmente que pueden controlarse en grupos de 512 mediante un circuito integrado de aplicación específica (ASIC). Antes de la secuenciación, los adaptadores se ligan a ambos extremos del ADN genómico o fragmentos de ADNc .

Estos adaptadores facilitan la captura de la cadena y la carga de una enzima posesiva en el extremo 5 'de una cadena.

La enzima es necesaria para garantizar el desplazamiento unidireccional de un solo nucleótido a lo largo de la cadena en una escala de tiempo de milisegundos.

ANÁLISIS BIOINFORMÁTICOS

martes, 25 de febrero de 2020

CHINA COMPARTE SECUENCIAS GENÓMICAS DE CINCO CEPAS DEL NUEVO CORONAVIRUS

sábado, 25 de enero de 2020

REQUIERE APOYO EN ANÁLISIS BIOINFORMÁTICOS?

ANÁLISIS GENÓMICO

Solicita Asesoría: !!!!!

CHINA COMPARTE SECUENCIAS GENÓMICAS DE CINCO CEPAS DEL NUEVO CORONAVIRUS

Denunciar abuso