Las losowy

To jest wół.

Stare, stare zdjęcie woksu.

Rysunek 19. Ox.

 

W 1906 roku zorganizowano konkurs prasowy w Anglii. 787 osób zgadło wagę woksu. Mediana błędu poszczególnych zgadywania wynosiła 37 lb (błąd 3,1%). Ogólnie mediana odczuć wynosiła tylko 9 lb od rzeczywistej wagi woska (1198 lb), co było błędem tylko 0,7%.

Histogram poszczególnych odgadliwań pokazujący większość zgadek skumulowanych wokół rzeczywistej wagi woła.

Rysunek 20. Histogram poszczególnych odgadnięć związanych z wagą.

 

Anegdota obrazuje mądrość tłumu: w niektórych sytuacjach zbiorowa ocena jest bardzo trafna.

Z tego mądrości wynika, że mądrość tłumu można modelować za pomocą tematu granicy centralnego: w skrócie błąd między kwadratem a średnią n Jeśli jednak zmienne nie są niezależne, różnica jest większa.

System systemów uczących się to zbiór modeli, których prognozy są uśredniane (lub w jakiś sposób zagregowane). Jeśli modele modeli różnią się odpowiednio od siebie, ale ich jakość jest ogólnie lepsza od jakości poszczególnych modeli. Zbiór potrzebuje więcej czasu na trenowanie i wnioskowanie niż pojedynczy model. Przecież trzeba przeprowadzać trenowanie i wnioskować na wielu modelach, a nie tylko na jednym.

Aby wszystko działało jak należy, poszczególne modele powinny być niezależne. Dla przykładu zespół składający się z 10 modeli (czyli całkowicie niezależny) nie będzie lepszy od konkretnego modelu. Z kolei wymuszanie niezależności modeli może pogorszyć ich jakość. Skuteczne grupowanie wymaga zachowania równowagi między niezależnością modelu a jakością jego modeli podrzędnych.