z+-+Anexo+3+(Práctica+2.3)

**Práctica 2.3**
Comparamos las secuencias aminoacídicas y nucleotídicas con la de humano para buscar homologías y posibles ortólogos.

Mus musculus
Aminoacídicas - Ventana: 25; Identidad: 100% [|mmusculus25-100.png] - Ventana: 30; Identidad: 75 % [|mmusculus30-75.png] Nucleotidicas - Ventana 25; Identidad: 100% [|MmusculusCDS25-100.png] - Ventana 30; Identidad 75% [|MmusculusCDS30-75.png]

Bos taurus
Aminoacídicas - Ventana: 25; Identidad: 100% [|btaurus25-100.png] - Ventana: 30; Identidad: 75 % [|Btaurus30-75.png] Nucleotídicas - Ventana 25; Identidad 100% [|BtaurusCDS25-100.png] - Ventana 30, Identidad 75% [|BtaurusCDS30-75.png]

Sarcophilus harrisii
Aminoacídicas - Ventana: 25; Identidad: 100% [|Sharrisii25-100.png] - Ventana: 30; Identidad: 75 % [|Sharrisii30-75.png]

**Gallus gallus**
Aminoacídicas - Ventana: 25; Identidad: 100% [|Ggallus25-100.png] - Ventana: 30; Identidad: 75 % [|Ggallus30-75.png] Nucleotídicas - Ventana 25; Identidad 100% [|GgallusCDS25-100.png] - Ventana 30; Identidad 75% [|GgallusCDS30-75.png]

Danio rerio
Aminoacídicas - Ventana: 25; Identidad: 100% [|Drerio25-100.png] - Ventana: 30; Identidad: 75 % [|Drerio30-75.png] Nucleotídicas - Ventana 25; Identidad 100% [|DrerioCDS25-100.png] - Ventana 30; Identidad 75% [|DrerioCDS30-75.png]

Xenopus tropicalis
Aminoacídicas - Ventana: 25; Identidad: 85% [|xenopus25-85.png] Nucleotídicas - Ventana; 30; Identidad 75% [|XtropicalisCDS30-75.png]

Heliconius numata numata
- Ventana: 20; Identidad 70% [|hnumata20-70.png]

**Ciona intestinalis**
- Ventana: 18. Identidad 60% [|Cintestinalis18-60.png]

Dictyostelium fasciculatum
- Ventana: 30; Identidad: 75 % [|Dfasciculatum30-75.png]

Polysphondylium pallidum
- Ventana: 30; Identidad: 75 % [|Ppallidum30-75.png]

__NOTA: LO SUBRAYADO ESTÁ PENDIENTE DE REVISIÓN POR LA COMISIÓN DE EXPERTOS DE LA REAL ACADEMIA DE LA LENGUA ZULÚ.__ >sp|Q03468|ERCC6_HUMAN DNA excision repair protein ERCC-6 OS=Homo sapiens GN=ERCC6 PE=1 SV=1 __Con el programa Ugen vamos a generar matrices de puntos que nos permitan comparar la secuencia de nuestro gen en el caso de los humanos (es nuestra secuencia referencia) con los posibles candidatos a ortólogos de otras especies, como ratón, mariposa, vaca o gallo.__ __CDS:__ MPNEGIPHSSQTQEQDCLQSQPVSNNEEMAIKQESGGDGEVEEYLSFRSVGDGLSTSAVG __Aquí hay algunas conclusiones. (Javi, Rafa, cuando leais esto mañana, guardad las matrices. En uniprot hay secuencias que no teníais, de otras especies como bacterias.aunque no tengan estrellas cogedlas) De Gaus gallus hay CDS en Uniprot. Y hay otras especies que se pueden coger que no tenemos. Guardad imagenes y adjuntadlas ok?__

__Esto es provisional, para que lo comprobeis mañana, borras cosas sin problemas:__ __HUMANO VS HUMUS MUSCULUS (RATÓN) 50 PB 70% ID: se ve claramente una diagonal principal. Son secuencias ortólogas.__ __50 PB 80% ID: Se pierde una pequeña parte de la parte medio-final de la secuencia.__ __Al poner secuencias más restrictivas nos damos cuenta de que se borran partes de todo el gen en general. Quizá la parte más conservada es la parte de arriba algo después de la región amino terminal.__ __HUMANO VS HELICONIUS NUMATA (MARIPOSA) 40 pb 60 % ID: Se ve una diagonal principal muy inclinada (debido a la diferencia de tamaños de las secuencias, para mariposa mucho menor que para humano) Muy poco ruido de fondo.__ __40 pb 70% ID: Nada de ruido, menos clara la diagonal. Se pierde la región C terminal.__ __Más restrictiva se conserva región cercana a amino terminal pero pronto no sale absolutamente nada.__ __HUMANO VS ZEBRAFISH: No tienen nada que ver!__

__PROTEÍNAS:__ __Muchos comparten identidad región 650 - 750 800 -950.__ __Xenopus comparte una region que no comparte ningun otro ortologo.__ __Dot plots 25 bp 100% y 30bp 75%.__ __Desestimamos la posibilidad de que la proteína ERCC6 de Ciona Intestinalis pueda ser un ortólogo de la ERCC6 humana debido a su nula similitud con esta en el dot plot.__ >tr|F6R5Z2|F6R5Z2_CALJA Uncharacterized protein OS=Callithrix jacchus GN=ERCC6 PE=4 SV=1MPNEGIPHSSQTQEQDCLQSQPVSNNEEMAIKQESSGDGEMEEYLRSHSVGDGLFTSAEGCASAAPRRAPALLHIDRHQIQAVEPSAQALELQGLGVDVYDQDVLEQGVLQQVDNAIHEASCASQLADAEKEYRLVLDDLMSCTISLRQINKIIEQLSPQAATSRDINRKLDSVKRQKYNKEQQLKKITAKQKRLQAILGGAEVKVELDHASLEEEDAEPGPSSLGSMLMPVQETAWEELIRTGQMTPFGTQIPQKQEKKPRKIMLNEASGFEKYLADQAKLSFERKKQACNKRAARKAPAPVISPAPMQNENKPNKKTKLLLKKEERLKKHIKKLQKRALQFQGKVGLPKTRRPWESDMRPQAEGDSEGEESEYFPTEEEEDDEVEGVEADLSGDGTDYELKSLPKGRKWQKKVPVQEIDDDLFLSSGEEAETSVGGGGGGGGRKVGRYRDDGDEDYYKWRLRRWNKLRLQDKKKRLKLEDDSEESDAEFDEGFKVPGFLFKKLFKYQQTGVRWLWELHCQQAGGILGDEMGLGKTIQIIAFLAGLSYSKIRTRGSNYRFEGLGPTVIVCPTTVMHQWVKEFHTWWPPFRVAILHETGSYTHKKEKLIRDVAHCHGILITSYSYIRLMQDDISRYDWHYVILDEGHKIRNPNAAVTLACKQFRTPHRIILSGSPMQNNLRELWSLFDFIFPGKLGTLPVFLEQFSVPITMGGYSNASPVQVKTAYKCACVLRDTINPYLLRRMKSDVKMSLSLPDKNEQVLFCRLTDEQHKVYQNFIDSKEVYRILNGEMQIFSGLIALRKICNHPDLFSGGPKNLKGLPDDELEEDQFGYWKRSGKMIVVESLLKIWHKQGQRVLLFSQSRQMLDILEVFLRAQKYTYLKMDGTTTIASRQPLITRYNEDKSIFVFLLTTRVGGLGVNLTGANRVVIYDPDWNPSTDTQARERAWRIGQKKQVTVYRLLTAGTIEEKIYHRQIFKQFLTNRVLKDPKQRRFFKSNDLYELFTLTSPDASQSTETSAIFAGTGSDVQTPKCHLKRKIQPAFGAEHDIPKHKKFPASNIPVNDATSSEEKPKAKGGEINAVTSSQSDPLKDDPHTSSNVTSSDRLGEETNAVFGPEESSVISGNGECSNSRTGKTSRLSGDESIDEKLGLSYKREIPSQAQTESFWENKQMENKFYKHKSKTKHHNAAEEKTLEKHLRPKQKSKNPKHCRDAKFEGTRIPYLVKKRRYQKQDTENKSEAKEQSNDDYVLEKLFKKSVGVHSVMKHDAIMDGASPDFVLVEAEANRVAQDALKALRLSHQRCLGAVSGVPTWTGHRGISGAPAGTKSRFGKKRNSNFSVQHPSSKSPAGKCQDGIMKKEVKDNVPGHFSGRAEDAESSSGALASSSLLAKMRARNHLILPERLESESGHLQEASAPLSTTEHDDLLVEMRNFIAFQAHTDGQASTREILQEFESKLSASQSCVFRELLRNLCTFHRTSGGEGIWKLKPEYC>tr|G3KAQ4|G3KAQ4_9NEOP DNA excision repair protein ERCC-6 (Fragment) OS=Heliconius numata silvana GN=ERCC6 PE=4 SV=1YNGIVKYIKDLLTKKWHYVILDEGHKIRNPDTQVSKLVKKFDTPHKILITGSPMQNSLQELWSLFDFMRPGLLGTYNTFMDHFATPITQGGYANATQHQEATALEIAKALKNIITPYILRRTKAEVQEHIKLPEKNEQVLFCALSREQRDLYMGYLTGSTVRSILDKDSKFGDPIRARVLVALTTLRKICNHPDLYLYEAQDDDEDIDEESFGNWKRSGKMSVVHSLLKIWLKQGHRTLIFSQSRAMLCILEQHLQKHKFEYLKMDGXVSVAQRQNLIKTFNENAKYLVFLATTRVGGLGVNLTG >tr|E1BFL2|E1BFL2_BOVIN Uncharacterized protein OS=Bos taurus GN=ERCC6 PE=4 SV=2MPNERIPHSSQTQEPDCSRSQDVSGSEEGTIKQEKDGDMDLGQSLPSCSSANGPSTSTEGCLLELPRRGPALLHIDRHQIQAVEPGAQALELQGLGVDVYDQDVLEQGVLQQVDSAIHEASCVAQLAEAEKEYRSVLDDLTSCTTSLRQIDKIIEQLGPQAATNKDINRKLDSVKRQKYNKEQQLKKITAKQKRLQAVLGGAEVQVELGLGGLEEEDAEAEPSCLGSMLMPAQETAWEELVRTGQMTPFGTKIPQKQEKKPRKLMLNEASGFEKYLADQAKLSFERKKQACNKRAAKKASASATSEPSSALNENKPDERGKAVSKTDKRLKKQIKKLQKRALQLQGQVGLLKGKKPWDCDVRPNAQGDSEDEESEYLPTEEELEETVGADLPGEGSDWEQRLVLNRRKRQKKVTVQEIDDDFFPSSGEEAEATGGGRKVVRCRDDGDEDYYKQRLSRWSITRLKQDKASLPWLDDITNSMDMNLSHGVRMPKIMRKSLYKYREKDNVFPGDIRCAQGAWELGDSTGHADAQRILAFLMKTSFKRLRVRGVYALFEGLGPTIIVCPTTVMHQWVKEFHTWWPAFRVAVLHETGSFTHKKEKLVRDIARCHGILITSYSYIRLMQDDISRHDWHYVILDEGHKIRNPNAAVTLACKQFRTPHRIILSGSPMQNNLRELWSLFDFIFPGKLGTLPVFMEQFSVPITMGGYSNASPVQVKTAYKCACVLRDTINPYLLRRMKSDVKMSLSLPDKNEQVLFCRLTDEQHKVYQNFIDSKEVYRILNGEMQIFSGLVALRKICNHPDLFSGGPKNLKGIPDEELGEDQFGYWKRSGKMIVVESLLKIWHKQGQRVLLFSQSRQMLDILEVFLRAQKYSYLKMDGTTAIASRQPLITRYNEDTSIFVFLLTTRVGGLGVNLTGANRVIIYDPDWNPSTDTQARERAWRIGQKKQVTVYRLLTAGTIEEKIYHRQIFKQFLTNRVLKDPKQRRFFKSNDLYELFTLSSPDTSQSTETSAIFAGTGSDVQTPKRHLKRRLQQACGTDQSVPVDRQFPDCKTSASAAMSSEEVCAASVSEVNAVTSDQGIPLNDAVQTPHSLTSSERLGEEADAVSRPRESSVIHGNGNSSDSPRVSRTCGVSGEESVSEKESLSDKRESCQVQREALWENEQTENNFYKHKSKMKHHVAEEPMEKHLRPNQKPKSSKHRRDAKFEGTRIPHLVKKRQYRRRDPAAESEAKERSHDDYVLEKLFRKSAGVHSVMKHDAIMDGASPDHVLVEAEANRVAQDALRALRLSRQQCLGAASGVPTWTGHRVLAGAPAGKKSRFGQKRNSSFSVQRPSSTSPKEKCQDSTVKKEGKDHVSEHFSGKAEDTESSSGALTSSSLLAKMRARNHLILPERLESESGRLPEAAAPLPCSTEHDDLLVEMRNFIAFQAQADGQASTREILQEFESKLSASQSCVFRELLRSLCTFHRTSAGEGIWKLKPE>tr|G3X3N1|G3X3N1_SARHA Uncharacterized protein OS=Sarcophilus harrisii GN=ERCC6 PE=4 SV=1MPNEATQHSGQTQEKDLNSPSFNNAEETAIGPENSAALDKMEESFTPSVFNNSPSTSSVVGMFEVPRKGPPVLHIDRQQIQSVEYSAQAVELKDLGVDVYDQDVLEQGVLQQVDKAIHEANRAAQLAEAEKEYHSVLDDLRSCTTSLKQINTIIEHLSPQAVNNKDVNRKLDSVKRQKCNKEKQLKKIKAKQKRLQAILGGAEREIEANLVDLEEDEEPGPSSLGSMLMPAQETEWEELIRTGQMTPFGTQIPQNQEKKPRKLMLNEASDFEKYLADQAKLSFERKKLSKQKKKKKIQTSVDSNTIPTSDEKEKNKTNGKQLKTDKHLKKHIKKLQRRAVQFQGKIKFLKEKKPLESKKAKYDQGSESEDSEYIPEEEEEEEEEEELALHATRRQDHTLKCVSKQRKQQNKTATEEIDDEYLPSSGEESIGKNGKIKRCQDDGDGNYYKQRLRRWNKQRLEDKEQRRKAEEESEESDAEFEEGFRMPGFLFKKLFKYQQTGVRWLWELHCQQAGGILGDEMGLGKTIQIIAFLAGLSYSKIRTRGSNYRFEGLGPTVIVCPTTVMHQWVREFHTWWPPFRVAILHETGSYANKKVTLIREIARCHGILITSYSYIRLMQDSINNHDWHYVILDEGHKIRNPNAAVTLACKQKKKKQFRTPHRIILSGSPMQNNLKELWSLFDFVFPGKLGTLPVFMEQFSVPITMGGYSNASPVQVKTAYKCACVLRDTINPYLLRRMKSDVKMSLSLPDKNEQSVKLFCYMVEKHHMFVPNFNFLNKKKKYMRILFLFQVFSGLVALRKICNHPDLFSGGPKIIKGIPDDELEEADQFGYWKRSGKMIVVESLLKIWHKQGHRVLLFSQSRQMLHLLEVFLRAREYSYLKMDGTTTIASRQPLITRYNEDTSIFVFLLTTRVGGIGVNLTGANRVIIYDPDWNPSTDTQARERAWRIGQKKQVTVYRVIVCGRTQKALYQQQIFKQFLTNRILKDPKQRRFFKSNDLYELFTLSSPDESQGTETSAIFAGTGSDVQAPKHHSKRKFHNSFPVADREDVNQADVSSECSTLSDANMSESTADLSQGKCKEKETDDNVHTQDKCAFTNTFSISDEPSKTVTILGNEEKLNSLSFTESFSSTGDEGLDTKQLPCETKSLQAKPDGSIESEQTENRFCKHKSKTKHHFVEGKDTLKHKGQKQNSHTAKHSKDAKFEGTRIPHLVKQKQYQKHDEEKEENEQKHDDYVLEKLFKRSVVGVHSVMKHDAIMEASSPDYVLVEAEANRVAQEALKALKMSRQRCLSAVSGVPTWTGSNGLSGAPAGGKSRFGQKRNPSLPAPQPSSKPTKEKGQDTGLKNATRTHFSGKTEDGESSSGALASSSLLASMRTRNHLTLSQRTENENVNLQQASVPLSTVTEHDDLLVEMRNFIAFQARVDGQASTQEILREFESKLSTSQSCVFRELLRNLCTFHRGVNGEGVWKLKPEF __NOTA: FALTA PRESENTAR LOS DOT PLOTS DE CDS Y PROTEÍNAS Y COMPARARLOS ENTRE SÍ. (no necesariamente con los mismos parámetros ya que el número de residuos posibles es diferente en DNA y proteínas).__

-Esta práctica se hace para buscar ortólogos y para ver regiones de especial conservación en las secuencias de distintos organismos. Con las matrices de puntos hemos descartado algunas secuencias que creíamos ortólogas.

__NOTA: SERÍA INTERESANTE HACER UNA TABLA COMPARANDO TODOS LOS RESULTADOS DE ORTÓLOGOS INCLUYENDO E-VALUE, LONGITUD, ETC. O INCLUSO COMPARANDO LOS RESULTADOS OBTENIDOS CON DOT PLOT Y CON BLAST.__