El teu blog de Linux en català

Probablement, l’eina més coneguda de la bioinformàtica entre els biòlegs és el BLAST. El BLAST (Basic Local Alignment Search Tool) és un programa informàtic d’alineament de seqüències de tipus local ja sigui de ADN o de proteïnes. Però, què volen dir tot aquest munt de paraules tan complicades? Intentarem explicar-ho amb la màxima claredat possible, anant pam a pam.

Hem de començar explicant per què ens interessa conèixer el genoma humà, i crec que la millor manera de fer-ho consisteix en fer un paral·lelisme entre el cos humà i un programa informàtic. Vosaltres sabeu que per saber realment com funciona un programa hem de conèixer quin és el seu codi font. Per tant, per saber com funciona el cos humà també hem de conèixer el seu codi font, que en aquest cas seria el material genètic: una combinació de 3000 milions de nucleòtids (subunitats de ADN). Informàticament, tots aquests nucleòtids es poden representar per una seqüència de lletres (hi ha quatre tipus diferents de nucleòtids i cada un es representa per una lletra diferent: A, T, C o G). En determinats punts d’aquesta seqüència es troben els anomenats gens, que segons tinguin una seqüència de lletres o una altra formaran una proteïna o una altra amb la seva respectiva funció.

http://www.abiertohastaelamanecer.ws/fp-content/images/genome.jpg

Els gens contenen la informació per crear les proteïnes

El genoma humà és un dels més estudiats i va ser descobert en la seva totalitat l’any 2003. Quan es busca el codi genètic d’altres organismes, sempre s’obtenen seqüències de nucleòtids que en un principi no se sap què volen dir. Gràcies a les investigacions, ja es coneixen quines són les seqüències dels gens humans i quines funcions tenen. Per tant, si comparem les seqüències de l’organisme que estem investigant amb les seqüències de ADN humà podem trobar regions locals que s’assemblin molt, i per tant, podrem descobrir els gens (i les seves funcions) del nou organisme.

Una vegada fets aquests aclariments, podem continuar amb la descripció del programa. El  BLAST és capaç de comparar una seqüència problema (comunament anomenada query, i que en l’exemple anterior seria una seqüència de l’organisme que s’està investigant) amb una gran quantitat de seqüències d’informació coneguda que es trobin en una base de dades. L’algorisme troba les seqüències de la base de dades que tenen major semblança a la seqüència query.

Volem saber quina funció té aquest gen

Volem saber quina funció té aquest gen del moniato

Normalment el BLAST és fa servir per a trobar probables gens homòlegs. En general, quan és obtinguda una nova seqüència, es fa servir el BLAST per a comparar-la amb altres seqüències que han estat prèviament caracteritzades i d’aquesta manera, poder trobar la seva funció de la nova seqüència. El BLAST és l’eina més usada per a l’anotació i predicció funcional de gens o seqüències proteiques. S’han creat moltes variants per a resoldre alguns problemes específics de recerca.

Després de fer un alineament amb el BLAST, descobrim que es tracta del gen beta-amilasa del moniato!

Després de fer un alineament amb el BLAST, descobrim que es tracta del gen que expressarà la proteïna beta-amilasa!

El BLAST és un programa de llicència lliure i es pot usar gratuïtament des del servidor de l’NCBI (National Center for Biotechnology Information, EE.UU.). Si es desitja també està disponible per a ser instal·lat localment. L’avantatge del servidor de l’NCBI és que l’usuari no ha de mantenir ni actualitzar les bases de dades i que la recerca es fa en un cluster d’ordinadors, que atorga molta rapidesa.