Toto je docela stará otázka s několika velmi dobrými odpověďmi, myslím si však, že nová odpověď může být přínosem pro řešení pragmatičtější perspektivy.
Kdy by nemělo být povoleno, aby se fixní efekt lišil na různých úrovních náhodného efektu?
Nebudu se zabývat problémy, které již byly popsány v ostatních odpovědích, místo toho budu odkazovat na nyní známý, i když bych raději řekl „neslavný“ dokument Barra a spol. (2013), často jen „Keep to maximální "
Barr, D. J., Levy, R., Scheepers, C. a Tily, H. J., 2013. Struktura náhodných efektů pro testování potvrzující hypotézy: Udržujte ji maximální. Journal of memory and language, 68 (3), pp.255-278.
V tomto článku autoři tvrdí, že by mělo být umožněno, aby se všechny fixní efekty lišily na různých úrovních faktorů seskupení (náhodné zachycení). Jejich argument je docela přesvědčivý - v zásadě to, že jim nedovolí li se měnit, ukládá modelu omezení. To je dobře popsáno v ostatních odpovědích. S tímto přístupem však existují potenciálně vážné problémy, které popsal Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. a Baayen, H., 2015. Parsimonious mixed models. předtisk arXiv arXiv: 1506.04967
Zde stojí za zmínku, že Bates je primárním autorem balíčku lme4
pro přizpůsobení smíšených modelů v R, což je pravděpodobně nejpoužívanější balíček pro takové modely. Bates a kol. Poznamenávají, že v mnoha aplikacích v reálném světě data jednoduše nepodporují maximální strukturu náhodných efektů, často proto, že v každém klastru není dostatečný počet pozorování pro příslušné proměnné. To se může projevit v modelech, které se neshodují, nebo jsou singulární v náhodných efektech. Svědčí o tom velké množství otázek o těchto modelech na tomto webu. Poznamenávají také, že Barr et al použili relativně jednoduchou simulaci, přičemž jako základ pro jejich práci byly použity „dobře vychované“ náhodné efekty. Místo toho Bates et al navrhují následující přístup:
Navrhli jsme (1) použít PCA k určení rozměrnosti matice rozptylu-kovarianční struktury struktury náhodných efektů, (2) zpočátku omezit korelační parametry na nulu, zvláště když počáteční pokus přizpůsobit maximální model ne konvergovat a (3) vypustit z modelu nevýznamné složky odchylek a jejich přidružené korelační parametry
Ve stejném příspěvku také poznamenávají:
Důležité je, že selhání konvergování není způsobeno vadami algoritmu odhadu, ale je přímým důsledkem pokusu o přizpůsobení modelu, který je příliš složitý na to, aby byl správně podporován daty.
A:
maximální modely nejsou nutné k ochraně před antikonzervativem
závěry. Tuto ochranu plně poskytují komplexní modely, které se řídí realistickými očekáváními o složitosti, kterou mohou data podporovat. Ve statistikách, stejně jako jinde ve vědě, je šetrnost ctností, nikoli svěrákem.
Bates a kol. (2015)
Z více aplikovaného hlediska je třeba vzít v úvahu, zda proces generování dat, biologická / fyzikální / chemická teorie, která je základem dat, by měl vést analytika ke specifikaci struktury náhodných efektů.