Proiectul ENCODEUn proiect de amploare care implică sute de oameni de ştiinţă sugerează că doar o porţiune foarte mică din genomul uman este cu adevărat non-funcţională, fiind posibil ca întregul genom să aibă funcţii utile. Detalii, în cele ce urmează.

 

 

 

 

În anul 2001 Proiectul Genomului Uman a avut ca rezultat o decodificare aproape completă a ADN-ului speciei umane. Dar cercetătorii ştiau foarte puţin despre modul în care A-urile, G-urile, C-urile şi T-urile erau utilizate, controlate sau organizate şi cu atât mai puţin despre modul în care acestea sunt codate în cazul unei persoane aflate în viaţă.

Acea lipsă de cunoştinţe tocmai s-a micşorat. Un proiect internaţional de amploare numit ENCODE, Enciclopedia Elementelor de ADN, a catalogat fiecare nucleotidă din cadrul genomului care are o funcţie. S-a constatat astfel că este vorba de semnificativ mai mult decât cele 1,5 procente din genom care conţin instrucţiuni concrete pentru crearea proteinelor. Proiectul de cercetare în cadrul căruia o echipă internaţională de 442 de oameni de ştiinţă şi-au unit eforturile timp de 10 ani arată că restul genomului - şi anume majoritatea necodantă - este totuşi des populată cu "elemente funcţionale."

"Genomul nu mai este o întindere vastă şi depopulată", a declarat Shyam Prabhakar de la Genome Institute din Singapore, care nu a fost implicat în studiu. "Acesta este înţesat de vârfuri şi semne de activitate biochimică."

"Aproape fiecare nucleotidă este asociată cu o funcţie de un anumit fel sau altul şi noi ştim acum unde sunt aceste nucleotide, ce se leagă de ele,  care sunt asocierile dintre ele şi chiar mai mult", a adăugat Tom Gingeras, unul dintre cei mai importanţi oameni de ştiinţă implicaţi în acest studiu. Rezultatele sunt în prezent publicate în mai mult de 30 de lucrări din diferite reviste.

Cercetătorii au recunoscut de mult timp că o parte din ADN-ul non-codant probabil are o funcţie şi multe exemple consistente au ieşit recent la lumină. În acelaşi timp, oamenii au crezut că o mare parte din aceste secvenţe au fost într-adevăr inutile. Proiectul ENCODE sugerează contrariul.

Cercetătorii au descoperit că multe părţi non-codante ale genomului uman conţin zone de fixare unde proteinele se pot lega afectând expresia atât a genelor aflate în apropiere, cât şi a celor aflate la distanţă. Alte regiuni non-codante sunt transcrise în molecule de ARN care nu sunt traduse în proteine. Iar alte regiuni afectează modul în care ADN-ul este pliat şi ambalat. În concluzie aceste regiuni nu sunt doar resturi. Aşa cum dezvăluie studiul ENCODE, 80% din genom posedă funcţii biochimice.

Nici restul de 20% nu poate fi considerat inutil, în conformitate cu Ewan Birney, coordonatorul principal al proiectului. El explică faptul că în timp ce  ENCODE a analizat 147 tipuri diferite de celule, în total există câteva mii. Dacă sunt examinate alte tipuri de celule, ar putea ieşi la iveală nişte funcţii şi pentru procentul rămas. "Este posibil ca procentul de 80% să ajungă până la 100%", a spus Birney. "Noi nu avem cu adevărat porţiuni mari de ADN redundant. Această metaforă - ADN-ul ″junk″ - nu este una tocmai reuşită ori folositoare.

Implicaţiile sunt enorme, plecând de la redefinirea noţiunii de "genă", până la a oferi noi indicii în încercarea de a înţelege bolile şi cum funcţionează genomul în trei dimensiuni. "Există câte ceva interesant pentru toţi cei de aici", a spus Prabhakar. "Indiferent care bucată a genomului se întâmplă să o studiem în cadrul unui anumit proiect, vom avea de câştigat dacă ne vom opri şi la descoperirile corespunzătoare acelui segment de ADN scoase la iveală în cadrul proiectului ENCODE."

Desigur că există încă un drum lung de parcurs, a remarcat Birney. "Cred că vom avea nevoie de acest întreg secol pentru a completa toate detaliile", a spus el. "Această reconciliere deplină va reprezenta ştiinţa acestui secol."


Prin intermediul cifrelor

Cercetătorii ştiau deja că 1,5% din genom codează proteine. Studiul ENCODE a constatat că un procent de 8.5% codează regiuni în care proteinele se fixează pe ADN şi reglează probabil transcrierea genei. Şi pentru că ENCODE nu a urmărit fiecare tip posibil de celule sau fiecare proteină posibilă care se lipeşte de ADN, această cifră nu este deloc exagerată, ba dimpotrivă. Birney estimează că proporţia totală a genomului care fie creează o proteină, fie se leagă de o proteină este de aproximativ 20%.

Restul elementelor funcţionale din cadrul studiului ENCODE acoperă alte clase de secvenţe despre care se credea iniţial că sunt nefuncţionale, inclusiv introni. "Afirmaţia că intronii sunt cu siguranţă un balast nu este adevărată", a afirmat Birney. Chiar şi unele secvenţe repetitive, porţiuni mici de ADN care au capacitatea de a se copia şi sunt de obicei privite ca paraziţi sunt susceptibile să fie funcţionale, adesea conţinând secvenţe în care proteinele se pot lega pentru a influenţa activitatea unor gene din apropiere. Poate că răspândirea lor în întreg genomul nu reprezintă invazia unui parazit, ci un mod de răspândire a controlului. "Aceşti paraziţi pot fi subminaţi uneori", a afirmat Birney.

Birney anticipează faptul că mulţi sceptici vor dezbate proporţia exactă, procentul de 80% al genomului care, conform estimărilor ENCODE, ar avea o  funcţie şi definiţia termenului "funcţional." Dar "indiferent cum îl vor împărţi, trebuie să ne obişnuim cu faptul că există o mulţime de lucruri legate de genom pe care nu le ştim."




Ce se află într-o genă?

Viziunea simplistă despre o genă este că aceasta este un şir de ADN care este transcris pentru a crea o proteină. Dar ţinând cont de datele obţinute cu ajutorul ENCODE această definiţie nu mai are sens. Există o mulţime de transcripţii, probabil mai multe decât ar fi realizat oricine, unele dintre ele conectând două gene anterior neconectate. Acest lucru înseamnă că  graniţele acestor gene trebuie să se extindă, iar spaţiile dintre ele se îngustează sau dispar.

Gingeras spune că acest spaţiu "intergenic" s-a micşorat de patru ori mai repede. "O regiune care a fost odată numită Gena X este acum contopită cu Gena Y", afirmă el. Cu astfel de limite confuze Gingeras crede că nu mai are sens să se gândească la o genă ca fiind un punct specific din genom sau ca fiind unitatea sa de bază. În schimb această onoare revine transcrierii ARN. "Atomul genomului este transcrierea", spune Gingeras. "Ea este unitatea de bază care este afectată de mutaţie şi selecţie."


Noi piste în cadrul studiului unor boli


În ultimul deceniu geneticienii au efectuat un număr aparent fără sfârşit de studii de asociere largă a genomului (SALG) şi au renunţat la o listă lungă de polimorfisme unice de nucleotide (PUN) care se corelează cu riscul apariţiei unor afecţiuni diferite. Echipa ENCODE a cartografiat toate aceste asocieri largi ale genomului şi au identificat toate polimorfismele unice de nucleotide cu ajutorul datelor.

Cercetătorii au descoperit că doar 12% din PUN cunoscute se află în zona de codare a proteinelor. Ei au arătat de asemenea că în comparație cu PUN prezente la întâmplare, cele asociate cu boala au o probabillitate de 60% mai mare de a se situa în regiuni non-codante dar funcţionale pe care ENCODE le-a identificat, în special în regiunea promotorilor şi potenţatorilor. Acest lucru sugerează faptul că multe dintre aceste variante controlează activitatea diferitelor gene şi oferă multe piste proaspete pentru a înţelege modul în care acestea afectează riscul nostru de a dezvolta o boală. "A fost unul dintre acele momente care par prea frumoase ca să fie adevărate", a declarat Birney. "Literalmente, am fost în acea încăpere [atunci când au ajuns rezultatele] şi reacţia instantanee a fost: Da! "

Cercetătorii ENCODE au descoperit conexiuni noi între PUN asociate cu boala şi elemente specifice ADN. De exemplu, au descoperit cinci PUN care cresc riscul de a dezvolta boală Crohn şi care sunt recunoscute de către un grup de factori de transcripţie numit GATA2. "Acest aspect nu a fost unul pe care biologii care studiază boala Crohn l-au avut în vedere", a spus Birney. "Dintr-o dată am făcut o asociere imparţială între o boală şi biologia de bază."

"Colaborăm în prezent cu o mulţime de biologi care studiază diferite boli urmărind seturile de date", a adăugat el. "Într-un fel ENCODE lucrează de la genom înspre exterior, în timp ce SALG acţionează în urma acţiunii". Până în prezent echipa a identificat 400 de astfel de locuri care merită analizate.


Genomul tridimensional

Descrierea genomului sub forma unui şir de litere invită la o eroare comună: că acesta reprezintă o entitate liniară bidimensională. În realitate ADN-ul este înfăşurat în jurul unor proteine numite histone asemeni unui şir de mărgele. Acestea sunt apoi răsucite, îndoite şi buclate formând  un complex tridimensional. În acest fel părţi îndepărtate ale genomului pot fi de fapt în mod natural vecine îşi pot afecta activitatea reciproc.

Job Dekker, un bioinformatician de la Universitatea din Massachusetts Medical School, a folosit datele ENCODE pentru a crea o hartă a acestor interacţiuni cu rază lungă pentru doar 1% din genom în trei tipuri diferite de celule şi a descoperit mai mult de 1.000 de astfel de interacţiuni. "Îmi place să spun că nimic din genom nu are sens decât sub forma unei reţele 3D", a spus Dekker. Disponibilitatea datelor noi obţinute cu ajutorul ENCODE este "într-adevăr o provocare pentru viitorul ştiinţei genomului", a adăugat el.


Partajarea datelor

Noile rezultate ENCODE sunt vaste şi au fost relatate în 30 de lucrări fundamentale din ″Nature″, ″Genome Biology″ şi ″Genome Research″, precum şi într-o mulţime de articole secundare în Science, Cell şi alte publicaţii. Şi toate datele sunt disponibile gratuit pentru public.

Paginile revistelor reprezintă o locaţie nepotrivită pentru un asemenea rezervor de informaţie, astfel că echipa ENCODE a conceput un model de publicare nou. Pe portalul proiectului ENCODE cititorii pot alege una dintre cele 13 teme de interes, cum ar fi secvenţele potenţatoare şi să le urmeze pe "fire" speciale care scot în evidenţă toate punctele relevante din cele 30 de lucrări principale. "Pentru ca să nu fie necesar să frunzăriţi în grabă toate cele 30 de lucrări şi să trebuiască să decideţi pe care dintre ele doriţi să le citiţi, noi scoatem în evidenţă elementele esenţiale pentru dumneavoastră", a afirmat Birney.

Echipa a construit de asemenea ceea ce ei numesc o Maşină Virtuală, un program care se poate descărca şi care include întreg codul sursă pe care oamenii de ştiinţă implicaţi în ENCODE l-au utilizat pentru a analiza datele. Orice cercetător poate descărca datele aproape neprelucrate şi poate reproduce oricare dintre analizele din aceste lucrări pe cont propriu. Vorbim practic de transparenţă maximă.

"Cu aceste proiecte ştiinţifice intensive la dispoziţie, ar trebui să existe un grad foarte mare de încredere în faptul că analiştii de date au făcut lucrurile în mod corect", a relatat Birney. Cu ajutorul maşinii virtuale "puteţi reda, pas cu pas, absolut tot ceea ce am făcut pentru a ajunge la aceste rezultate. Cred că acesta ar trebui să reprezinte standardul pentru viitor."




Traducere realizată de Ecaterina Pavel după getting-to-know-the-genome, cu acordul editorului.