Pentru a vă înregistra, vă rugăm să trimiteți un email către administratorul site-ului.
Pune o întrebare

3.6k intrebari

6.8k raspunsuri

15.5k comentarii

2.5k utilizatori

0 plusuri 0 minusuri
685 vizualizari

O întrebare la care caut ajutor:

Generez un set de n numere aleatoare cu distribuție normală (Gauss) care are media 0 și deviația standard s (să zicem 1). Apoi calculez deviația standard a valorilor din set. Repet operația pentru m seturi și calculez media deviației standard din toate seturile.

Rezultatul este că media găsită pentru deviațiile standard este în general (cu excepția unor fluctuații rare) mai mică decît deviația standard a generatorului de numere aleatoare. E drept, pe măsură ce n devine foarte mare, diferența dintre deviația standard a generatorului și a seturilor generate devine foarte mică.

Ce se întîmplă?

Expert (12.9k puncte) in categoria Matematica
1 0

Neavând nici cea mai mică idee despre ce se întâmplă în problemă am simulat în Excel seturi de numere ale distribuției normale standard. Rezultatul nu s-a confirmat, media deviațiilor standard oscilând foarte aproape de 1, cănd sub, când peste.
Probabil că dimensiunea seturilor trebuia să fie mai mare sau mult mai mare, ori formula folosită pentru deviația standard nu este precisă. Am folosit seturi de 10.000 de numere și 

\small s=\sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-x_{mediu})^{2}}
Cam ce n și m ați folosit în experiment?

0 0
Mulțumesc pentru încercare.

Am făcut și eu simulări, în Excel și în MATLAB. Necazul cu Excel este că nu mă pricep să-i dau să reitereze generarea setului de un număr mare de ori și să-mi facă media deviațiilor standard. La o singură generare sau la doar cîteva efectul nu se vede. Deviația iese într-adevăr cînd mai mare, cînd mai mică și-ți dă impresia că fluctuațiile sînt echilibrate.

Nu mă interesează ce se întîmplă cînd setul e infinit de mare. Lucrez la o problemă cu seturi mici, de 100 sau 1000 de numere aleatoare, caz în care diferența dintre deviația standard de la intrare diferă semnificativ de cea de la ieșire (semnificativ în cazul meu înseamnă 1 la mie sau pe-acolo). Cu valorile lui m am mers pînă la 1.000.000, dar efectul se vede și la m-uri mici, de pe la 1000 încolo.

Cu siguranță există un mod de a calcula teoretic cît ar trebui să iasă deviația standard a seturilor generate.

O întrebare secundară ar fi care este deviația standard a deviațiilor standard obținute. Pentru asta simulările merg ușor, fără să fie nevoie de m-uri mari.

Da, și eu tot formula cu n-1 o folosesc pentru a calcula deviația standard. Formula cu n dă abateri și mai mari.
1 0

Ca fapt divers, din enunț nu-mi dau seama dacă media deviațiilor standard ați calculat-o făcând media aritmetică a deviațiilor sau ați considerat-o ca fiind radicalul varianței medii?

\frac{s_{1}+...+s_{m}}{m}\; \; sau\; \; \; \sqrt{\frac{s_{1}^{2}+...+s_{m}^{2}}{m}}\; \; \; ?

Pentru deviația standard a distribuției deviațiilor obținute există formula:

s=\sqrt{1-\frac{2}{n-1}\cdot (\frac{\Gamma (\frac{n}{2})}{\Gamma (\frac{n-1}{2})})^{2}}\; \; \; , \; \; \; \; \Gamma (k)=(k-1)!

0 0
Media deviațiilor am calculat-o ca medie simplă.

PS. Dar întrebarea a fost foarte bună, cred (nu știu încă). Am refăcut simulările înlocuind media deviațiilor cu radical din media varianțelor, iar aceasta iese egală (plus fluctuații echilibrate) cu deviația statistică de la intrare. Cred că mai am multe de învățat despre varianțe etc. Mulțumesc.
0 0

Mediile calculate cu radicalul varianței medii sunt mai mari conform inegalității Cauchy-Buniakowski-Schwarz:

\sum_{i=1}^{n}a_{i}^{2}\sum_{i=1}^{n}b_{i}^{2}\geq (\sum_{i=1}^{n}a_{i}b_{i})^{2}\; \; ,cu\; \; \; a_{i}=s_{i}\; \; si\; \; \; b_{i}=1

Te rugam sa te autentifici sau sa te inregistrezi pentru a raspunde la aceasta intrebare.

...