
Probabilitatea stă la baza inteligenței artificiale, a criptografiei și a statisticii. Totuși, așa cum spunea filozoful Bertrand Russell, „Probabilitatea este cel mai important concept din știința modernă, mai ales pentru că nimeni nu are cea mai vagă idee ce înseamnă cu adevărat”. Predau statistică inginerilor, astfel că știu că, deși probabilitatea este importantă, ea este contraintuitivă.
Probabilitatea este o ramură a matematicii care descrie caracterul aleator. Atunci când oamenii de știință vorbesc despre aleatoriu, ei se referă la evenimente întâmplătoare — precum aruncarea unei monede — nu la întâmplări bizare, cum ar fi o persoană îmbrăcată ca o zebră. Deși oamenii de știință nu au o metodă de a prezice evenimentele bizare, probabilitatea permite prezicerea comportamentului pe termen lung — adică a tendințelor care apar dintr-un număr mare de evenimente repetate.
Modelarea cu ajutorul probabilității
Deoarece probabilitatea se referă la evenimente, un cercetător trebuie să aleagă ce evenimente studiază. Această alegere definește spațiul eșantionului. De exemplu, atunci când arunci o monedă, poți defini evenimentul prin modul în care aceasta cade.
Monedele cad aproape întotdeauna pe „cap” sau pe „pajură”. Totuși, este posibil — deși foarte puțin probabil — ca moneda să se oprească pe muchie. Prin urmare, pentru a construi spațiul eșantionului ai două opțiuni: cap și pajură sau cap, pajură și muchie. Pentru moment, ignorăm situațiile în care moneda cade pe muchie și folosim ca spațiu eșantional doar cap și pajură.
Următorul pas este atribuirea de probabilități evenimentelor. Probabilitatea descrie rata de apariție a unui eveniment și ia valori între 0% și 100%. De exemplu, o aruncare corectă a unei monede tinde să producă 50% cap și 50% pajură.
Pentru a atribui probabilități, trebuie însă analizat cu atenție scenariul. Ce se întâmplă dacă persoana care aruncă moneda trișează? Există o tehnică subtilă prin care moneda poate fi „clătinată” fără a fi aruncată efectiv, controlându-se rezultatul. Chiar și atunci când trișatul este exclus, aruncările reale au o ușoară tendință de a se opri pe aceeași față cu care au pornit — astfel, dacă moneda este lansată cu capul în sus, este foarte puțin mai probabil să cadă tot pe cap.
Atât în cazul trișării, cât și în cel al aruncării reale, este nevoie de un spațiu eșantional adecvat: fața inițială și fața opusă. Pentru a obține o aruncare echitabilă în lumea reală, ar fi necesar un pas suplimentar prin care fața inițială este aleasă aleatoriu, cu probabilități egale, înainte de aruncare.

Aceste ipoteze se acumulează rapid. Pentru a avea o aruncare corectă, a trebuit să ignorăm cazurile în care moneda cade pe muchie, să presupunem că nimeni nu trișează și să presupunem că fața inițială este aleasă uniform aleator. Împreună, aceste ipoteze constituie un model al aruncării monedei cu rezultate aleatoare. Probabilitatea ne spune cum se comportă pe termen lung un model aleator. În cazul modelului monedei, probabilitatea descrie câte aruncări vor produce cap dintr-un număr mare de încercări.
Dar de ce să folosim un model aleator și să nu rezolvăm problema prin fizică? De fapt, oamenii de știință au făcut acest lucru, iar fizica arată că mici variații ale vitezei aruncării determină dacă moneda cade pe cap sau pe pajură. Această sensibilitate face rezultatul imprevizibil, astfel încât un model aleator este adecvat.
Frecvență versus probabilitate
Probabilitatea diferă de frecvență, care reprezintă rata de apariție a evenimentelor într-o secvență. De exemplu, dacă arunci o monedă de opt ori și obții două rezultate cap, frecvența este de 25%. Chiar dacă probabilitatea de a obține cap este de 50% pe termen lung, fiecare secvență scurtă va produce rezultate diferite. Patru cap și patru pajură reprezintă rezultatul cel mai probabil pentru opt aruncări, dar pot apărea — și vor apărea — și alte combinații.
Frecvența și probabilitatea coincid într-un caz special: atunci când numărul de observații tinde către infinit. În acest sens, probabilitatea descrie comportamentul pe termen lung.

Aplicații în IA, criptografie și statistică
Probabilitatea nu este utilă doar pentru a prezice aruncările unei monede. Ea stă la baza multor sisteme tehnologice moderne.
De exemplu, sistemele de IA precum modelele lingvistice mari (LLM) se bazează pe predicția următorului cuvânt. În esență, ele calculează probabilitatea cuvintelor care urmează după un prompt. De pildă, pentru promptul „New York”, cuvinte precum „City” sau „State” pot apărea ca predicții, deoarece acestea urmează cel mai frecvent în datele de antrenare.
Dar, deoarece probabilitatea descrie aleatoriul, rezultatele unui LLM sunt și ele aleatoare. La fel cum o serie de aruncări de monedă nu produce de fiecare dată aceeași succesiune, dacă adresezi aceeași întrebare unui LLM, vei obține de regulă răspunsuri diferite. Practic, fiecare cuvânt următor este tratat ca o nouă aruncare de monedă.
Aleatorietatea este esențială și în criptografie — știința protejării informației. Comunicarea criptografică folosește un secret comun, precum o parolă, pentru securizarea datelor. Totuși, caracterul surprinzător nu este suficient pentru securitate, motiv pentru care alegerea unui cuvânt neobișnuit reprezintă o parolă slabă. Un secret comun este sigur doar dacă este dificil de ghicit. Chiar dacă un cuvânt pare surprinzător, cuvintele reale sunt mai ușor de ghicit decât dacă ai „arunca o monedă” pentru fiecare literă.
Poți crea parole mult mai puternice folosind probabilitatea pentru a selecta caractere aleator de pe tastatură — sau, și mai bine, folosind un manager de parole.
În sfârșit, aleatorietatea este fundamentală în statistică. Statisticienii proiectează și analizează studii pentru a valorifica date limitate. Această practică este deosebit de importantă în cercetarea medicală, deoarece fiecare punct de date reprezintă viața unei persoane.
Standardul de aur este studiul clinic randomizat și controlat. Participanții sunt repartizați fie către tratamentul nou, fie către tratamentul standard printr-un proces echivalent cu o aruncare echitabilă a unei monede. Poate părea ciudat ca o astfel de decizie să fie luată aleatoriu — folosind „aruncări de monedă” pentru decizii care privesc vieți omenești. Totuși, imprevizibilitatea joacă un rol esențial, deoarece asigură că nimic legat de persoană nu influențează probabilitatea de a primi tratamentul: nu vârsta, sexul, rasa, venitul sau orice alt factor. Astfel, cercetătorii pot avea încredere că rezultatul observat este cauzat doar de tratament, nu de alți factori.
Așadar, ce înseamnă probabilitatea? Ca orice formă de matematică, ea este doar un model, ceea ce înseamnă că nu poate descrie perfect lumea reală. În exemplele discutate, probabilitatea este utilă pentru descrierea comportamentelor pe termen lung și pentru utilizarea imprevizibilității în rezolvarea unor probleme practice.
Traducere după Probability underlies much of the modern world de Zachary del Rosario, profesor de inginerie, Olin College of Engineering.
