t-+Frecuencias+aminoacídicas

Análisis de frecuencias aminoacídicas de ERCC6
//Realizado por Javier Viña González.//

Se utilizó un programa en lenguaje perl para analizar el contenido aminoacídico de ERCC6. El código del programa puede consultarse. El programa toma una secuencia de aminoácido en formato de texto plano o FASTA a partir de un fichero y devuelve otro fichero en el que se encuentran la secuencia en sí, las frecuencias absolutas y relativas de los aminoácidos que componen la secuencia. Así mismo devuelve las frecuencias absolutas y relativas de los aminoácidos polares, apolares, ácidos, básicos, fosforilables, aromáticos y aminoácidos propios de lazos (prolina y glicina). También muestra el número de aminoácidos totales y el accesion number de la proteína si la secuencia proteica está en formato FASTA. El resultado de la ejecución de este programa con la secuencia de ERCC6 puede consultarse.

En el resultado obtenido se observa que la frecuencia relativa de aminoácidos básicos es mayor a la frecuencia relativa de aminoácidos ácidos. Esto podría deberse a que ERCC6 es una proteína de unión a DNA, y puesto que este es ácido, el carácter básico de nuestra proteína podría aumentar la afinidad de ésta por el DNA. Para comprobar esta hipótesis se utilizó el mismo programa con otra proteína de unión a DNA, la [|TATA Box Protein (TBP)]. El resultado de la ejecución del programa con TBP puede consultarse. Efectivamente la frecuencia relativa de aminoácidos básicos de esta proteína también es mayor que la frecuencia relativa de aminoácidos ácidos, lo cual consolida la idea de que esto pudiera deberse a la función de la proteína. Sin embargo para contrastar estos resultados se realizó el mismo análisis con el mismo programa en una proteína que no interaccionase con DNA, la enzima [|aconitasa humana]. El resultado de la ejecución del programa con la secuencia de la aconitasa humana puede consultarse. Puesto que la frecuencia relativa de aminoácidos básicos también es mayor que la de aminoácidos ácidos y esta proteína no interacciona con DNA, no podemos afirmar que haya una relación entre las frecuencias relativas de aminoácidos ácidos y básicos y la interacción con DNA de ERCC6. La frecuencia relativa de triptófano es bastante elevada en comparación a otras proteínas, esto resulta relevante ya que la presencia de este aminoácido suele darse únicamente cuando es indispensable para alguna función concreta.

Por otro lado, se realizó el análisis con la proteína [|BSA], esta proteína tiene aplicaciones en cuantificación de proteínas mediante la medida de la absorbancia a 280 nm de concentraciones conocidas de esta proteína, de manera que se elabora una recta de calibrado que relaciona la absorbancia a esta longitud de onda con la concentración proteica. Los aminoácidos aromáticos son los responsables de la absorbancia a 280 nm, por lo que proteínas con contenidos relativos similares de aminoácidos aromáticos pueden ser cuantificados por esta técnica. El objetivo de nuestro análisis es comparar la frecuencias relativas de aminoácidos aromáticos para determinar si sería posible la cuantificación de ERCC6 mediante esta técnica. El resultado del análisis en BSA puede ser consultado. Acorde a los resultados obtenidos, se puede afirmar que ERCC6 puede ser cuantificado mediante la técnica descrita ya que el contenido relativo en aminoácidos aromáticos entre ERCC6 y BSA es similar.


 * Análisis de las frecuencia de aminoácidos de la estructura primaria de la proteína CSB**

//Realizado por Juan Bardallo Jiménez.//

Utilizando el programa escrito en lenguaje perl que creamos al principio de la asignatura, vamos a analizar la proporción de aminoácidos que posee la proteína de estudio. Ejecutando en el programa el archivo que contiene la secuencia, nos devuelve el siguiente texto:

El numero total de aminoacidos es: 1493 Aminoacido A, frecuencia 93, frecuencia relativa 0.0622906898861353 Aminoacido C, frecuencia 20, frecuencia relativa 0.0133958472873409 Aminoacido D, frecuencia 85, frecuencia relativa 0.0569323509711989 Aminoacido E, frecuencia 126, frecuencia relativa 0.0843938379102478 Aminoacido F, frecuencia 52, frecuencia relativa 0.0348292029470864 Aminoacido G, frecuencia 103, frecuencia relativa 0.0689886135298058 Aminoacido H, frecuencia 40, frecuencia relativa 0.0267916945746818 Aminoacido I, frecuencia 64, frecuencia relativa 0.042866711319491 Aminoacido K, frecuencia 126, frecuencia relativa 0.0843938379102478 Aminoacido L, frecuencia 128, frecuencia relativa 0.0857334226389819 Aminoacido M, frecuencia 27, frecuencia relativa 0.0180843938379102 Aminoacido N, frecuencia 53, frecuencia relativa 0.0354989953114535 Aminoacido P, frecuencia 71, frecuencia relativa 0.0475552578700603 Aminoacido Q, frecuencia 85, frecuencia relativa 0.0569323509711989 Aminoacido R, frecuencia 92, frecuencia relativa 0.0616208975217683 Aminoacido S, frecuencia 122, frecuencia relativa 0.0817146684527796 Aminoacido T, frecuencia 72, frecuencia relativa 0.0482250502344273 Aminoacido V, frecuencia 80, frecuencia relativa 0.0535833891493637 Aminoacido W, frecuencia 17, frecuencia relativa 0.0113864701942398 Aminoacido Y, frecuencia 37, frecuencia relativa 0.0247823174815807

Vemos que los aminoácidos más comunes son L (leucina), K (lisina), E (ácido glutámico) y S (serina). Son aminoácidos que se encuentran muy representados en todas las proteínas, ya que están implicados en formar la estructura general y en estabilizar la proteína. La lisina se caracteriza por ser de carácter básico, a diferencia del ácido glutámico. Suponemos que hay abundancia tanto en aminoácidos ácidos como básicos para asegurar la estabilidad y la compactación de la proteína.

Los aminoácidos básicos son K (lisina), R(arginina) y H (histidina), y sus frecuencias absolutas son 126, 92 y 40 respectivamente. En total acumulan una frecuencia relativa de 17,28%, que no es mucho más que el portentaje que acumula de residuos ´´acidos, D y E, 85 y 126 respectivamente que suman un 14,13% del total de la proteína. Por tanto, en términos generales podemos decir que la proteína tiene un carácter levemente básico, lo que confirma uno de los resultados anteriormente hallados: Esta proteína tiene un carácter básico (que a pH fisiológico tiene carga positiva) que hace que sea afín a las cadenas de ADN (de carácter ácido y de carga negativa debido a los grupos fosfato de su estructura).

Suponemos que la relación ácidos/bases es cercana a 1 porque contribuye a la estabilidad de la proteína, y observando en el alineamiento múltiple confirmamos lo que sospechábamos: Hay una alta tasa de estos aminoácidos básicos (K, R Y H) en las regiones funcionales de las proteínas, los dominios. Tiene sentido ya que es por esta zona por donde se une e interacciona con el ADN, y por tanto concuerda que una zona positiva se una con otra negativa.

También nos ha llamado la atención que gran parte de las mutaciones que producen el síndrome de Cockayne (según vemos en las fichas de Uniprot) están relacionadas con cambios en posiciones que originalmente contienen los aminoácidos R o H. La histidina es un aminoácido que por lo general no suele encontrarse en mucha proporción en las secuencias de proteínas. Esto se debe a que su aparición tiene que ver con funciones concretas y específicas en el organismo, y su mutación puede ocasionar graves enfermedades.

Con respecto a los demás aminoácidos que aparecen en multitud, comprobamos que son aminoácidos muy comunes en la estructura de las proteínas y deducimos que tienen que ver con su correcto plegamiento y guardar la estructura general.

**Análisis computacional de la secuencia primaria de ERCC6**
//Rafael Domínguez Acemel//

La frecuencia de aminoácidos que componen nuestra proteína de interés fue determinado mediante un algoritmo en lenguaje Perl, que puede ser descargado pulsando en el. Este programa fue levemente modificado con respecto al entregado para que aportara información sobre la frecuencia de aminoácidos con características comunes, agrupando básicos, ácidos, fosforilables, usuales en lazos, polares, apolares, aromaticos, etc.

El archivo con los resultados generado por el programa se descarga pulsando en el. Lo que más llama la atención es la mayor proporción de aminoácidos básicos que ácidos. Esto puede tener que ver con que se trate de una proteínas de interacción con el ADN. Para comprobarlo hemos realizado dos cálculos más con el programa utilizando las secuencias de NFkB, un factor de transcripción, y, la seroalbúmina bovina. Tanto NFkB como ERCC6 presentan un 4% más de aminoácidos ácidos que básico, mientras que BSA los tiene equilibrados. Serían necesarios más calculos para saber si podrías ponerse a punto un sistema de identificación de proteínas localizadas en el núcleo según su porcentaje de aminoácidos básicos.Ocurre lo mismo con la frecuencia de aminoácidos relacionados con la formación de lazos (prolina y glicina), también un 4% más presentes en NFkB y ERCC6 que en BSA y quizás responsables de la formación de lazos de interacción.

Llaman la atención los 17 triptófanos que aparecen en la estructura primaria, más de un uno por ciento del total de aminoácidos de la proteína. Haría falta ver donde se encuentran los mismos, probablemente aquellos que se encuentren fuera de los dos dominios estén involucrados en procesos de regulación o interacción no descritos, ya que la evolución suele presionar hacia la presencia del menor número de triptófanos innecesarios.

Otra conclusión interesante es que la proporción de aminoácidos aromáticos entre BSA y ERCC6 es parecida, lo que nos permitiría usar como patrón a la proteína de vaca cometiendo poco error en multitud de métodos de cuantificación de proteínas basados en la presencia de dichos aminoácidos, como puede ser la medición de absorbancia a 280nm.