La diferencia clave entre similitud e identidad en la alineación de secuencias es que la similitud es la semejanza (semejanza) entre dos secuencias en comparación, mientras que la identidad es la cantidad de caracteres que coinciden exactamente entre dos secuencias diferentes.
La bioinformática es un campo interdisciplinario de la ciencia que involucra principalmente la biología molecular y la genética, la informática, las matemáticas y la estadística. La alineación de secuencias es un término importante en bioinformática. Es el procedimiento en el que se ordenan las secuencias de ADN, ARN o proteína para identificar regiones de semejanza que son consecuencia de la relación funcional, estructural o evolutiva entre las secuencias. Al final de la alineación, se presentarán como filas dentro de una matriz. Para alinear los caracteres idénticos en columnas sucesivas, se insertan espacios entre los residuos.
¿Qué es la similitud?
La similitud en la alineación de secuencias es el parecido entre dos secuencias cuando se comparan. Este hecho depende de la identidad de las secuencias. La similitud representa la medida en que los residuos están alineados. Por lo tanto, secuencias similares contienen propiedades similares. En bioinformática, la similitud es una herramienta para evaluar la similitud entre dos proteínas.
Figura 01: Similitud en la alineación de secuencias
Hay dos pasos principales en el proceso de alineación de secuencias. El paso inicial es la alineación por pares, que ayuda a encontrar la alineación óptima entre dos secuencias (incluidos los espacios) mediante algoritmos como BLAST, FastA y LALIGN. El algoritmo de coincidencia encuentra el número mínimo de operaciones de edición; in-dels y sustituciones para alinear una secuencia con la otra secuencia. Después de la alineación por pares, es necesario obtener dos parámetros cuantitativos de cada comparación por pares. Son identidad y semejanza.
¿Qué es la identidad?
La identidad en la alineación de secuencias es el número de caracteres que coinciden exactamente entre dos secuencias diferentes. Por lo tanto, las lagunas no cuentan al evaluar la identidad. Se considera que la medición está relacionada con la secuencia más corta entre las dos secuencias. Implica significativamente que tiene el efecto donde la identidad de secuencia no es transitiva. Si X=Y e Y=Z, entonces X no es necesariamente igual a Z. Esto se deduce en términos de la medida de distancia de identidad.
Figura 02: Identidad en alineación de secuencia
Por ejemplo, X tiene una secuencia de AAGGCTT, Y tiene una secuencia de AAGGC y Z tiene una secuencia de AAGGCAT. La identidad entre X e Y es 100% {5 nucleótidos idénticos/min[longitud(X), longitud(Y)]}. La identidad entre Y y Z también es del 100%. Pero la identidad entre X y Z es solo del 85 % {(6 nucleótidos idénticos / 7)}.
¿Cuáles son las similitudes entre similitud e identidad en la alineación de secuencias?
- Tanto la similitud como la identidad son dos términos que usamos en la alineación de secuencias.
- Además, se refieren al parecido entre las dos secuencias.
- Además, los expresamos como un valor porcentual.
¿Cuál es la diferencia entre similitud e identidad en la alineación de secuencias?
La similitud en la alineación indica el parecido entre dos secuencias cuando se comparan, mientras que la identidad en la alineación de secuencia indica la cantidad de caracteres que coinciden exactamente entre dos secuencias diferentes. Por lo tanto, esta es la diferencia clave entre similitud e identidad en la alineación de secuencias.
Resumen: similitud frente a identidad en la alineación de secuencias
La alineación de secuencias ayuda a identificar regiones de semejanza en el ADN, ARN o proteínas resultantes de la relación funcional, estructural o evolutiva entre las secuencias. Por lo tanto, la similitud y la identidad son dos términos clave en el contexto de la alineación de secuencias. La diferencia clave entre estos dos términos es que la similitud es el parecido entre dos secuencias en comparación, mientras que la identidad es la cantidad de caracteres que coinciden exactamente entre dos secuencias diferentes. Por lo tanto, este es el resumen de la diferencia entre similitud e identidad en la alineación de secuencias.