Jaké reference by měly být citovány na podporu použití 30 jako dostatečně velké velikosti vzorku?

Otázka:

Lan

2010-09-10 22:07:39 UTC

view on stackexchange narkive permalink

Mnohokrát jsem četl / slyšel, že velikost vzorku nejméně 30 jednotek je považována za „velký vzorek“ (předpoklady normality prostředků obvykle platí přibližně kvůli CLT, ...). Proto ve svých experimentech obvykle generuji vzorky 30 jednotek. Můžete mi prosím poskytnout nějaký odkaz, který by měl být citován při použití velikosti vzorku 30?

Bez odkazu na počet parametrů, které se pokoušíte odhadnout, nebo ekvivalentní druh modelu, se kterým pracujete, se zdá být docela obtížné vám dát jasnou odpověď.

Přijetí n = 30 jako hranice malých a velkých vzorků není dobře podporováno žádnou statistickou technikou.

čtyři odpovědi:

Carlos Accioly

2010-09-11 00:42:17 UTC

view on stackexchange narkive permalink

„Magické číslo“ 30 je ve skutečnosti klam. Podívejte se na nádherný příspěvek Jacoba Cohena, Věci, které jsem se naučil (zatím) (Am. Psych. Prosinec 1990 45 # 12, str. 1304-1312). Tento mýtus je jeho prvním příkladem toho, že „některé věci, které se naučíte, nejsou tak“.

[O] ne mých kolegů doktorandů provedl disertační práci [se] vzorkem pouze 20 případů na skupinu. ... [L] ater Zjistil jsem ... že pro srovnání dvou nezávislých skupin se střední hodnotou $ n = 30 $ na skupinu u posvěcených dvou- sledovaná $. 05 $ úroveň, pravděpodobnost, že středně velký efekt bude označen jako významný ... a t testem, byla pouze $. 47 $ . Šlo tedy přibližně o převrácení mince, zda by člověk získal významný výsledek, i když ve skutečnosti měla velikost efektu smysl. ... [Můj přítel] skončil s nevýznamnými výsledky - s nimiž pokračoval v demolici důležité větve psychoanalytické teorie.

Krásná reference - a spot na relevantní. Děkuji.

@whuber Pamatujete si, o jaký papír se jednalo?Odkaz je nyní přerušen.Možná tento http://psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf, „Věci, které jsem se naučil (zatím)“?Rok se shoduje s rokem v adrese URL nefunkčního odkazu.

@Amoeba Tento dokument jsem uložil, když jsem si ho přečetl, abych mohl potvrdit, co jste našli, je zamýšlený.Aktualizoval jsem tuto odpověď tak, aby spolu s odkazem obsahoval citaci.

@Carlos Accioly Aktualizoval jsem to novým odkazem, protože předchozí byl přerušen.

user1108

2010-09-10 22:44:59 UTC

view on stackexchange narkive permalink

Volba n = 30 pro hranici mezi malými a velkými vzorky je pouze pravidlem. Existuje velké množství knih, které tuto hodnotu citují (kolem), například Hogg a Tanis Pravděpodobnost a statistická inference (7e) uvádějí „větší než 25 nebo 30“.

To znamená, že příběh mi řekl, že jediným důvodem, proč byla 30 považována za dobrou hranici, bylo to, že to umožnilo hezké studentské t tabulky v zadní části učebnic, aby se pěkně vešly na jednu stránku. To a kritické hodnoty (mezi Studentovým t a normálním) jsou vypnuty pouze přibližně o 0,25, každopádně od df = 30 do df = nekonečno. Na ručním výpočtu na rozdílu vlastně nezáleželo.

V dnešní době je snadné vypočítat kritické hodnoty pro vše možné na 15 desetinných míst. Kromě toho máme metody převzorkování a permutace, u nichž nejsme omezeni ani na parametrické distribuce populace.

V praxi se nikdy nespoléhám na n = 30. Vykreslete data . Překryjte normální rozdělení, pokud chcete. Vizuálně posuďte, zda je normální aproximace vhodná (a zeptejte se, zda je aproximace vůbec skutečně nutná). Pokud je generování vzorků pro výzkum a aproximace povinné, vygenerujte dostatek velikosti vzorku, aby byla aproximace tak blízko, jak je požadováno (nebo co nejblíže výpočtově proveditelné).

Zde je stránka o tom, jak dobrá je normální aproximace rozdělení t pro n = 30. http://www.johndcook.com/normal_approx_to_t.html

bhm

2010-09-10 23:41:43 UTC

view on stackexchange narkive permalink

IMO, vše záleží na tom, pro co chcete použít svůj vzorek. Dva „hloupé“ příklady pro ilustraci toho, co mám na mysli: Pokud potřebujete odhadnout průměr, 30 pozorování je víc než dost. Pokud potřebujete odhadnout lineární regresi se 100 prediktory, 30 pozorování nebude dost blízko.

user603

2010-09-11 00:05:05 UTC

view on stackexchange narkive permalink

Většinou svévolné pravidlo. Toto tvrzení závisí na řadě faktorů, které mají být pravdivé. Například o distribuci dat. Pokud data pocházejí například z Cauchy, ani 30 ^ 30 pozorování nestačí k odhadu průměru (v takovém případě by ani nekonečný počet pozorování nestačil k tomu, aby způsobil $ \ bar {\ mu} ^ {(n)} $ ke konvergenci). Toto číslo (30) je také nepravdivé, pokud hodnoty, které kreslíte, nejsou na sobě navzájem nezávislé (opět můžete mít, že vůbec nedochází ke konvergenci bez ohledu na velikost vzorku). CLT potřebuje v zásadě dva pilíře:

Že náhodné proměnné jsou nezávislé: že můžete znovu uspořádat svá pozorování bez ztráty jakýchkoli informací *.
Že rv pocházejí z distribuce s konečnými sekundovými momenty: což znamená, že klasické odhady střední a střední hodnoty mají tendenci konvergovat s rostoucí velikostí vzorku.

(Obě tyto podmínky mohou být poněkud oslabeny, ale rozdíly jsou převážně teoretické povahy)

Váš příklad ilustruje hodnotu robustních statistik. * Medián vzorku * odhaduje parametr umístění Cauchyho distribučního vrtu. Dalo by se namítnout, že nejslabším článkem při použití t-testu s 30 vzorky je t-test, nikoli 30 vzorků.

John:> „Dalo by se namítnout, že nejslabším článkem při použití t-testu s 30 vzorky je t-test, ne 30 vzorků“. Velmi pravdivé a také předpoklad, že data jsou * iid *. Medián je také MLE pro Cauchyovy distribuované náhodné proměnné (a tedy efektivní), ale obecně byste mohli potřebovat více než 30 pozorování.

Ne všechny verze CLT se spoléhají na identickou distribuci, dokonce ani na nezávislost. Základní ty, které se učí podgradovat, často ano, ale existují verze, které nedělají oba předpoklady, např. [Lyapunov CLT] (http://en.wikipedia.org/wiki/Central_limit_theorem#Lyapunov_CLT) předpokládá nezávislost, ale ne identické distribuce, a podmínku nezávislosti lze také uvolnit, například [viz zde] (http: // en .wikipedia.org / wiki / Central_limit_theorem # CLT_under_weak_dependence). Tato „změna pořadí“ také není to samé jako nezávislost. Některé formy závislosti se nespoléhají na pořádek.

Velikost vzorku 50 000 není dostatečná pro to, aby CLT fungoval dostatečně dobře na výpočet intervalu spolehlivosti pro průměr distribuce log-normal.

ⓘ

Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 2.0, pod kterou je distribuován.

about - legalese