Volba n = 30 pro hranici mezi malými a velkými vzorky je pouze pravidlem. Existuje velké množství knih, které tuto hodnotu citují (kolem), například Hogg a Tanis Pravděpodobnost a statistická inference (7e) uvádějí „větší než 25 nebo 30“.
To znamená, že příběh mi řekl, že jediným důvodem, proč byla 30 považována za dobrou hranici, bylo to, že to umožnilo hezké studentské t tabulky v zadní části učebnic, aby se pěkně vešly na jednu stránku. To a kritické hodnoty (mezi Studentovým t a normálním) jsou vypnuty pouze přibližně o 0,25, každopádně od df = 30 do df = nekonečno. Na ručním výpočtu na rozdílu vlastně nezáleželo.
V dnešní době je snadné vypočítat kritické hodnoty pro vše možné na 15 desetinných míst. Kromě toho máme metody převzorkování a permutace, u nichž nejsme omezeni ani na parametrické distribuce populace.
V praxi se nikdy nespoléhám na n = 30. Vykreslete data . Překryjte normální rozdělení, pokud chcete. Vizuálně posuďte, zda je normální aproximace vhodná (a zeptejte se, zda je aproximace vůbec skutečně nutná). Pokud je generování vzorků pro výzkum a aproximace povinné, vygenerujte dostatek velikosti vzorku, aby byla aproximace tak blízko, jak je požadováno (nebo co nejblíže výpočtově proveditelné).