To jest wół.
Rysunek 19. Ox.
W 1906 roku zorganizowano konkurs prasowy w Anglii. 787 osób zgadło wagę woksu. Mediana błędu poszczególnych zgadywania wynosiła 37 lb (błąd 3,1%). Ogólnie mediana odczuć wynosiła tylko 9 lb od rzeczywistej wagi woska (1198 lb), co było błędem tylko 0,7%.
Rysunek 20. Histogram poszczególnych odgadnięć związanych z wagą.
Anegdota obrazuje mądrość tłumu: w niektórych sytuacjach zbiorowa ocena jest bardzo trafna.
Z tego mądrości wynika, że mądrość tłumu można modelować za pomocą tematu granicy centralnego: w skrócie błąd między kwadratem a średnią n Jeśli jednak zmienne nie są niezależne, różnica jest większa.
System systemów uczących się to zbiór modeli, których prognozy są uśredniane (lub w jakiś sposób zagregowane). Jeśli modele modeli różnią się odpowiednio od siebie, ale ich jakość jest ogólnie lepsza od jakości poszczególnych modeli. Zbiór potrzebuje więcej czasu na trenowanie i wnioskowanie niż pojedynczy model. Przecież trzeba przeprowadzać trenowanie i wnioskować na wielu modelach, a nie tylko na jednym.
Aby wszystko działało jak należy, poszczególne modele powinny być niezależne. Dla przykładu zespół składający się z 10 modeli (czyli całkowicie niezależny) nie będzie lepszy od konkretnego modelu. Z kolei wymuszanie niezależności modeli może pogorszyć ich jakość. Skuteczne grupowanie wymaga zachowania równowagi między niezależnością modelu a jakością jego modeli podrzędnych.