Cum am putea construi o maşină ca Deep Thought, un computer superinteligent care ar putea să ne răspundă la întrebările esenţiale despre viaţă, Univers şi despre orice altceva? Inteligenţa este un concept foarte dificil şi, până de curând, nimeni nu a reuşit să ofere o definiţie satisfăcătoare pentru aceasta. Cei mai mulţi cercetători au renunţat în se lupta pentru o definiţie generală a noţiunii de inteligenţă, concentrându-se, în loc,, pe concepte conexe, dar mai limitate.

 

 

Eu susţin că definirea matematică a inteligenţei este nu numai posibilă, dar ea este crucială pentru înţelegerea şi crearea unor maşini superinteligente. Grupul meu de cercetare a creat cu succes un software care poate învăţa să joace Pac-Man de la zero. Permiteţi-mi să vă explic, în primul rând, cum trebuie să definim „inteligenţa".

Deci, ce este inteligenţa?

Am lucrat la problema inteligenţei raţionale generale mai mulţi ani. Grupul meu de lucru a analizat lucrări de psihologie, filozofie şi de inteligenţă artificială şi a căutat definiţiile pe care cercetătorii independenţi sau grupuri de cercetători au încercat să le dea pentru conceptul de inteligenţă.

Caracterizările sunt foarte diverse, dar se pare că există o temă recurentă care ar putea fi enunţată în următoarea definiţie: inteligenţa reprezintă capacitatea cuiva de a-şi atinge obiectivele sau de a se descurca într-o gamă largă de contexte.

Puteţi fi surprinşi sau sceptici şi să întrebaţi cum este posibil ca această afirmaţie sau oricare alta asemănătoare ei să poată surprinde complexitatea inteligenţei. Există două răspunsuri la această întrebare:

1. Alte aspecte ale inteligenţei sunt implicite în această definiţie: dacă vreau să reuşesc într-o lume complexă sau pentru a atinge obiective dificile, trebuie să dobândesc cunoştinţe noi, să învăţ, să gândesc logic şi inductiv, să am capacitatea de generalizare, să pot recunoaşte modele, să-mi fac planuri, să întreţin conversaţii, să supravieţuiesc şi să am mai multe alte trăsături care sunt asociate de obicei cu inteligenţa.

2. Provocarea este de a transforma această definiţie verbală care constă doar în câteva cuvinte în ecuaţii reprezentative care trebuiesc analizate.

Asta este ce am făcut în ultimii 15 ani. Citez aici afirmaţia matematicianului american Clifford A. Truesdell: „Nu există nimic din ceea ce se poate transmite prin simboluri matematice şi prin relaţiile dintre acestea care să nu poată fi exprimat, de asemenea, prin cuvinte. Reciproca, cu toate acestea, este falsă. Multe dintre declaraţiile care pot fi exprimate uşor prin cuvinte nu pot fi puse în ecuaţii, pentru că este un nonsens".

Într-adevăr, eu mai întâi am creat ecuaţiile şi abia mai târziu le-am convertit în limba engleză.


Inteligenţa artificială universală

Acest domeniu ştiinţific este numit inteligenţa artificială universală în care robotul AIXI este superinteligenţa care rezultă. Următoarea ecuaţie reprezintă definiţia abstractă a inteligenţei şi anume capacitatea de a reuşi sau de a atinge anumite obiective în diferite situaţii:


Explicarea fiecărui membru al ecuaţiei de mai sus ar necesita un întreg articol separat (sau o carte!), dar semnificaţia din spatele ei este următoarea: AIXI are o componentă de planificare şi o componentă de învăţare.

Imaginaţi-vă un robot care se deplasează în mediul înconjurător. Iniţial el are foarte puţine cunoştinţe despre lume sau chiar nu are deloc, dar dobândeşte informaţii din exterior prin intermediul senzorilor săi şi îşi construieşte un model aproximativ cu privire la modul în care funcţionează lumea.

El reuşeşte să facă aceasta prin utilizarea unor metode generale foarte bune cu privire la modul prin care se poate deduce acest model pe baza datelor ce provin din situaţii arbitrare complexe. Această teorie îşi are rădăcinile în teoria informaţiei algoritmice a cărei ideea de bază este aceea de a căuta cel mai simplu model ce descrie datele existente.

Modelul obţinut nu este perfect, dar el este actualizat în mod continuu. Noile observaţiile îi permit lui AIXI să-şi îmbunătăţească modelul asupra lumii şi care în timp devine din ce în ce mai bun. Aceasta este componenta de învăţare.

În continuare AIXI foloseşte acest model pentru a putea prezice viitorul şi se bazează în deciziile sale pe predicţiile obţinute cu ajutorul modelului său. AIXI în acest moment poate analiza diverse posibile acţiuni viitoare: „dacă acţionez într-un mod, apoi continui cu o altă acţiune, se va întâmpla aşa sau aşa, ceea ce ar putea fi bun sau rău. Şi dacă aş schimba secvenţa de acţiune ar putea fi mai bine sau mai rău".

„Singurul" lucru pe care AIXI trebuie să-l facă este să aleagă cea mai bună secvenţă de acţiuni viitoare din cele pe care le-a avut în vedere în conformitate cu modelul învăţat, prin „bună/rea/cea mai bună", înţelegând de fapt urmărirea unui obiectiv. AIXI primeşte ocazional recompense, care ar putea veni de la un profesor (uman), să fie încorporate (cum ar fi de exemplu că nivelul bateriei mare/mic este bun/rău ori faptul că găsirea de apă pe Marte este ceva bun, iar răsturnarea pe timpul misiunii ceva rău) sau să vină prin atingerea unor scopuri universale, cum ar fi căutarea de noi cunoştinţe.

Scopul lui AIXI este de a obţine cât mai multe recompense pe toată durata sa de viaţă, aceasta fiind partea de planificare.

În rezumat, fiecare ciclu de interacţiune constă în observare, învăţare, predicţie, planificare, decizie, acţiune şi recompensă, urmat de următorul ciclu. AIXI integrează numeroase principii filosofice, de calcul şi statistice, precum ar fi:

Briciul lui Occam - principiul după care se alege modelul (simplitatea)
Principiul lui Epicur al interpretărilor multiple - pentru justificarea modelului
Regula lui Bayes - pentru actualizarea convingerilor
Maşinile Turing - ca un limbaj descriptiv universal
Complexitatea Kolmogorov - care cuantifică simplitatea
Teoria inferenţei inductive universale a lui Solomonoff
Ecuaţiile Bellman - privind luarea secvenţială a deciziei.

Teoria şi practica unei inteligenţe artificiale universale

Ecuaţia de mai sus defineşte într-un mod exact şi unic o superinteligenţă care învaţă să acţioneze optim în diverse medii necunoscute. Aceasta s-ar putea dovedi, într-un anumit sens, cel mai inteligent sistem posibil. Reţineţi că aceasta este o explicaţie succintă, în cuvinte, a unor teoreme matematice, dar aceasta este esenţa problemei. Deoarece AIXI nu poate fi realizat în forma ideală de mai sus, el trebuie să fie realizat cu aproximaţie, în practică. În ultimii ani noi am creat diferite metode de aproximare care variază de la algoritmi optimi la unii ce pot fi implementaţi.

În acest moment noi suntem într-o etapă a jocurilor cu AIXI: el poate învăţa să joace Pac - Man, TicTacToe, Kuhn Poker şi alte asemenea jocuri. Important nu este că AIXI este capabil să  joace astfel de jocuri (acestea nu sunt dificile), ci faptul că el poate învăţa în mod autonom să reacţioneze la această mare varietate de situaţii cu care se confruntă.

AIXI nu avea cunoştinţe anterioare despre aceste jocuri. El nici măcar nu cunoştea regulile jocurilor.

El a început de la zero şi doar prin interacţiunea cu aceste medii şi-a putut da seama ce se întâmplă şi a învăţat cum să acţioneze mai bine. Aceasta este o caracteristică într-adevăr impresionantă a lui AIXI şi constituie principala sa diferenţă faţă de alte proiecte.

Chiar dacă Deep Blue de la IBM joacă şah mai bine decât marii maeştri ai şahului, acesta a fost special conceput pentru a face acest lucru şi el nu poate juca Jeopardy. În consecinţă, programul IBM "Watson" îi bate pe oameni la Jeopardy, dar nu poate juca şah şi nici măcar TicTacToe sau Pac - Man.

AIXI nu este proiectat pentru o aplicaţie anume. Dacă interacţionaţi cu el, atunci el va învăţa să acţioneze din ce în ce mai bine. Aproximările actuale sunt, desigur, foarte limitate. Pentru componenta de învăţare noi folosim algoritmi standard de compresie a fişierelor (procesele de învăţare şi cele de compresie reprezintă probleme care sunt strâns legate între ele). Pentru componenta de planificare noi utilizăm algoritmii standard Monte Carlo (de căutare aleatorie).

Nicio componentă nu are inclusă informaţie din vreun domeniu (ca, de exemplu, regulile Pac-Man ori TicTacToe).

Desigur noi a trebuit să conectăm AIXI la joc, astfel încât el să poată observa ecranul şi să poată acţiona în consecinţă şi voi va trebui să-l răsplătiţi pentru succesele obţinute jucând TicTacToe ori Pac-Pam, dar în rest AIXI se descurcă singur.



Traducere de Cristian-George Podariu după super-intelligent-machine-equation cu acordul editorului