Četl jsem Černou labuť před pár lety. Myšlenka Black Swan je dobrá a útok na ludický klam (vidět věci, jako by to byly hry s kostkami, se známými pravděpodobnostmi) je dobrý, ale statistiky jsou nehorázně zkreslené, přičemž ústředním problémem je nesprávné tvrzení, že pokud se proměnné promění v všechny statistiky, nejsou normálně distribuovány. Tento aspekt mě dostatečně naštval, abych napsal Talebovi následující dopis:
Vážený doktore Talebe,
Nedávno jsem četl „The Black Swan“. Stejně jako vy jsem fanouškem Karla Poppera a zjistil jsem, že souhlasím s tím, co v něm je. Myslím, že vaše expozice ludického klamu je v zásadě zdravá a upozorňuje na skutečný a běžný problém. Myslím si však, že velká část části III nechává váš celkový argument špatně klesnout, a to až do té míry, že by mohla diskreditovat zbytek knihy. To je škoda, protože si myslím, že argumenty týkající se Černých labutí a „neznámých neznámých“ stojí na jejich opodstatněnosti, aniž by se spoléhaly na některé chyby v části III.
Hlavní problém, na který bych chtěl poukázat - a usiluji o vaši odpověď, zvláště pokud jsem nepochopil problémy - je vaše zkreslení oblasti aplikované statistiky. Podle mého názoru kapitoly 14, 15 a 16 do značné míry závisí na argumentu slaměného muže, zkreslování statistik a ekonometrie. Obor ekonometrie, který popisujete, není ten, kterému jsem se učil, když jsem studoval aplikovanou statistiku, ekonometrii a teorii pojistně-matematických rizik (na Australian National University, ale s použitím textů, které se zdály docela standardní). Problémy, které nastolíte (například omezení Gaussových distribucí), jsou dobře a skutečně pochopeny a vyučovány, dokonce i na vysokoškolské úrovni.
Například se snažíte ukázat, jak rozdělení příjmů nenásleduje normální rozdělení, a prezentujete to jako argument proti statistické praxi obecně. Žádný příslušný statistik by nikdy netvrdil, že ano, a způsoby řešení této otázky jsou dobře zavedené. Pouhé použití technik na nejzákladnější úrovni „ekonometrie prvního roku“, například transformace proměnné pomocí jejího logaritmu, by vaše numerické příklady vypadaly mnohem méně přesvědčivě. Taková transformace by ve skutečnosti zneplatnila mnoho z toho, co říkáte, protože pak se rozptyl původní proměnné zvyšuje, jak se zvyšuje její průměr.
Jsem si jistý, že existují někteří nekompetentní ekonometři, kteří dělají regresi OLS atd. s netransformovanou proměnnou odpovědi, jak říkáte, ale to je dělá nekompetentními a používá techniky, které jsou dobře zavedené jako nevhodné. Určitě by selhaly ani na vysokoškolských kurzech, které tráví mnoho času hledáním vhodnějších způsobů modelování proměnných, jako je příjem, což odráží skutečné pozorované (negaussovské) rozdělení.
Rodina zobecněného lineárního Modely jsou jednou sadou technik vyvinutých částečně k obcházení problémů, které vyvoláváte. Mnoho z exponenciální rodiny distribucí (např. Gama, exponenciální a Poissonovo rozdělení) je asymetrické a má rozptyl, který se zvyšuje s rostoucím středem distribuce a obchází problém, na který poukazujete pomocí Gaussova rozdělení. Pokud je to stále příliš omezující, je možné úplně zrušit již existující „tvar“ a jednoduše specifikovat vztah mezi průměrem distribuce a jeho rozptylem (např. Umožněním rozptylu úměrně s druhou mocninou průměru), pomocí metody odhadu „kvazi-pravděpodobnosti“.
Samozřejmě můžete namítnout, že tato forma modelování je stále příliš zjednodušující a intelektuální past, která nás uklidňuje k tomu, abychom si mysleli, že budoucnost bude jako minulost. Možná máte pravdu, a myslím, že síla vaší knihy je přimět lidi jako já, aby to zvážili. Ale potřebujete jiné argumenty než ty, které používáte v kapitolách 14-16. Velká váha, kterou kladete na skutečnost, že rozptyl Gaussova rozdělení je konstantní bez ohledu na jeho průměr (například, který způsobuje problémy se škálovatelností), je neplatná. Váš důraz je tedy kladen na skutečnost, že skutečné distribuce mají tendenci být spíše asymetrické než křivky.
V zásadě jste zvolili jedno přílišné zjednodušení nejzákladnějšího přístupu ke statistice (naivní modelování surového proměnné, které mají Gaussovo rozdělení) a ukázaly, ve velké délce, (správně) nedostatky tak zjednodušeného přístupu. Tímto způsobem pak vytvoříte mezeru pro diskreditaci celého pole. Jde buď o vážný logický výpadek, nebo o propagandistickou techniku. Je to poľutováníhodné, protože to snižuje vaši celkovou argumentaci, z nichž většinu (jak jsem řekl) považuji za platnou a přesvědčivou.
Zajímalo by mě, co jste odpověděli. Pochybuji, že jsem první, kdo nastolil tento problém.
S pozdravem
PE