Przewodnik po systemach rankingowych wyszukiwarki Google
Google korzysta z automatycznych systemów rankingowych, które uwzględniają wiele czynników i sygnałów z setek miliardów stron internetowych i innych treści w naszym indeksie wyszukiwania, aby prezentować najbardziej trafne i przydatne wyniki w ułamku sekundy.
Regularnie ulepszamy te systemy przez rygorystyczne testy i ocenę oraz powiadamiamy o aktualizacjach naszych systemów rankingowych, gdy mogą mieć znaczenie dla twórców treści i innych użytkowników.
Na tej stronie znajdziesz wskazówki, które pomogą Ci poznać niektóre z najbardziej wartościowych systemów rankingowych. Obejmuje ona niektóre systemy będące częścią naszych podstawowych systemów rankingowych, które są podstawowymi technologiami generującymi wyniki wyszukiwania w odpowiedzi na zapytania. Omawiamy na niej też niektóre systemy powiązane z określonymi potrzebami dotyczącymi rankingu.
Możesz też odwiedzić stronę Jak działa wyszukiwarka, aby dowiedzieć się, jak nasze systemy rankingowe w połączeniu z innymi procesami współpracują ze sobą, aby wyszukiwarka Google mogła spełniać misję porządkowania informacji z całego świata oraz udostępniania ich do ogólnego użytku.
BERT
Dwukierunkowe reprezentacje enkodera z transformatorów (BERT) to system AI, który pozwala nam zrozumieć, jak kombinacje słów wyrażają różne znaczenia i intencje.
Systemy informacji kryzysowych
Opracowaliśmy systemy, które przekazują przydatne i aktualne informacje w czasie kryzysu - zarówno w sytuacji kryzysu osobistego, jak i podczas klęsk żywiołowych czy innych sytuacji kryzysowych o dużym zasięgu.
- Kryzys osobisty: nasze systemy sprawdzają, kiedy użytkownicy szukają informacji o osobistych sytuacjach kryzysowych, aby wyświetlać infolinie i treści od zaufanych organizacji dotyczące zapytań związanych z samobójstwami, przemocą seksualną, otruciem, przemocą na tle tożsamości płciowej lub uzależnieniem od narkotyków. Dowiedz się więcej o wyświetlaniu w wyszukiwarce Google informacji o sytuacjach kryzysowych.
- Powiadomienia SOS: w czasie klęsk żywiołowych lub rozległej sytuacji kryzysowej nasz system powiadomień SOS wyświetla komunikaty od władz lokalnych, krajowych lub międzynarodowych. Te powiadomienia mogą obejmować np. alarmowe numery telefonów i strony internetowe, mapy, tłumaczenia przydatnych wyrażeń czy informacje o możliwościach przekazania darowizny. Dowiedz się więcej o tym, jak działają powiadomienia SOS jako element ostrzeżeń o wydarzeniach kryzysowych Google, które są przydatne w przypadku powodzi, pożarów, trzęsień ziemi, huraganów i innych katastrof.
Systemy deduplikacji
W wyszukiwarce Google mogą znajdować się tysiące, a nawet miliony pasujących stron internetowych. Niektóre z nich mogą być bardzo podobne. W takich przypadkach nasze systemy wyświetlają tylko najbardziej trafne wyniki, aby uniknąć powielania treści. Dowiedz się więcej o tym, jak działa usuwanie duplikatów i jak wyświetlić pominięte wyniki w przypadku działania deduplikacji.
Deduplikacja jest stosowana również w przypadku fragmentów z odpowiedzią. Jeśli strona internetowa zostanie użyta do wyświetlenia fragmentu z odpowiedzią, nie będziemy jej powtarzać na pierwszej stronie wyników wyszukiwania. Zwiększa to przejrzystość wyników i ułatwia znajdowanie przydatnych informacji.
System domen o dopasowaniu ścisłym
Nasze systemy rankingowe uwzględniają słowa w nazwach domen jako jeden z wielu czynników decydujących o tym, czy treść pasuje do wyszukiwania. Nasz system domen o dopasowaniu ścisłym działa jednak tak, aby nie przypisywać zbyt dużego udziału treściom przechowywanym w domenach, które zostały zaprojektowane po to, aby dokładnie pasowały do określonych zapytań. Ktoś może np. utworzyć nazwę domeny zawierającą słowa „najlepsze-miejsca-na-obiad”, licząc na to, że w ten sposób uzyska wyższą pozycję treści w rankingu. Nasz system dostosowuje się do takich sytuacji.
Systemy aktualności
Stosujemy różne systemy typu „zapytanie zasługuje na aktualność”, zaprojektowane tak, aby wyświetlać bardziej aktualne treści dla zapytań, w przypadku których jest to oczekiwane. Jeśli na przykład ktoś szuka informacji o filmie, które właśnie wszedł na ekrany, najprawdopodobniej interesują go najnowsze recenzje, a nie starsze artykuły z czasu początku produkcji. Inny przykład: zwykłe wyszukanie hasła „trzęsienie ziemi” może zwrócić informacje o przygotowaniu i zasobach. Jeśli jednak trzęsienie ziemi miało miejsce niedawno, mogą pojawić się najnowsze artykuły i wiadomości.
Systemy analizy linków i PageRank
Stosujemy różne systemy analizujące to, jak poszczególne strony się ze sobą łączą. Pozwala to określać, czego dotyczą poszczególne strony i które z nich mogą być najbardziej przydatne w odpowiedzi na dane zapytanie. Jednym z naszych podstawowych systemów rankingowych używanych od początku istnienia Google jest PageRank. Jeśli chcesz dowiedzieć się więcej, przeczytaj oryginalny artykuł badawczy na temat PageRank i patent. Od tego czasu funkcja PageRank nieustannie się zmienia i nadal jest częścią naszych podstawowych systemów rankingowych.
Systemy wiadomości lokalnych
Mamy systemy, które identyfikują i wyświetlają lokalne źródła wiadomości, gdy wyniki z nich są trafne, np. za pomocą funkcji najważniejszych artykułów i wiadomości lokalnych.
MUM
Wielozadaniowy Ujednolicony Model (MUM) to system AI, który potrafi rozumieć i generować język. Obecnie nie służy do określania pozycji w rankingu w wyszukiwarce, ale do konkretnych zastosowań, takich jak poprawa wyszukiwania informacji na temat szczepionek przeciw COVID-19 i poprawa wyświetlanych przez nas objaśnień do fragmentów z odpowiedzią.
Dopasowywanie neuronowe
Dopasowanie neuronowe to system AI, dzięki któremu Google interpretuje koncepcje w zapytaniach i na stronach oraz dopasowuje je do siebie.
Systemy treści oryginalnych
Mamy systemy, które mogą pomóc w wyświetlaniu oryginalnych treści (w tym m.in. oryginalnych raportów) w wynikach wyszukiwania na wyższych pozycjach niż strony, które je tylko cytują. Obejmuje to obsługę specjalnych znaczników strony kanonicznej, których twórcy mogą użyć, aby wskazać wyszukiwarce, która strona jest stroną główną, jeśli została ona zduplikowana w kilku miejscach.
Systemy przesuwania w dół na podstawie usunięć
Nasze zasady zezwalają na usuwanie określonych typów treści. Jeśli przetwarzamy dużą liczbę próśb o usunięcie treści z konkretnej witryny, wykorzystujemy to jako sygnał do ulepszenia wyników wyszukiwania. W szczególności:
- Usunięcie ze względów prawnych: Gdy otrzymujemy dużą liczbę prawidłowych żądań usunięcia treści z powodu naruszenia praw autorskich w danej witrynie, możemy na tej podstawie obniżyć pozycję innych treści z tej witryny w naszych wynikach. Dlatego w przypadku występowania innych treści naruszających prawo użytkownicy rzadziej będą mieli do nich dostęp. Podobne sygnały przesuwające stronę w dół stosujemy w przypadku skarg dotyczących zniesławienia, podróbek produktów i usunięć na podstawie orzeczenia sądowego. W przypadku materiałów związanych z wykorzystywaniem seksualnym dzieci (CSAM) zawsze usuwamy takie treści, gdy je zidentyfikujemy. Przesuwamy w dół wszystkie materiały ze stron, na których występuje duży odsetek CSAM.
- Usuwanie danych osobowych: Jeśli przetwarzamy usuwanie dużej ilości danych osobowych z witryny z uciążliwymi zasadami usuwania treści, inne treści z tej witryny w wynikach przesuwamy w dół. Sprawdzamy również, czy ten sam schemat działania występuje w innych witrynach, a jeśli tak, przesuwamy w dół treści w tych witrynach. Podobne praktyki przesuwania w dół możemy stosować w przypadku witryn, w których występuje dużo usunięć treści takich jak doxing, niecenzuralne zdjęcia osób zrobione lub udostępnione bez zgody; niecenzuralne fałszywe treści publikowane bez zgody.
System decydujący o pozycji fragmentu w rankingu
Ranking fragmentów to system AI, który służy do identyfikowania poszczególnych sekcji lub fragmentów na stronie w celu lepszego rozpoznania, jak trafna jest dana strona.
RankBrain
RankBrain to system AI, który pomaga nam zrozumieć, jak słowa wiążą się z koncepcjami. Oznacza to, że możemy trafniej dopasowywać treści, nawet jeśli nie zawierają one dokładnie wszystkich słów użytych w wyszukiwaniu, gdy wiemy, że dane treści są powiązane z innymi słowami i pojęciami.
Systemy rzetelnych informacji
Różne systemy działają na wiele sposobów, aby pokazywać najbardziej wiarygodne informacje, np. pomagają prezentować więcej wiarygodnych stron i przesuwać w dół treści o niskiej jakości i promują dziennikarstwo wysokiej jakości. Gdy brak wiarygodnych informacji, nasze systemy automatycznie wyświetlają ostrzeżenia dotyczące treści w przypadku szybko zmieniających się tematów oraz wtedy, gdy nie mają pewności co do ogólnej jakości wyników wyszukiwania. Pokazują wskazówki, jak wyszukiwać wyniki, które mogą być bardziej przydatne. Dowiedz się więcej o naszym podejściu do udostępniania wysokiej jakości informacji w wyszukiwarce.
System opinii
System opinii ma na celu skuteczniejsze nagradzanie wysokiej jakości opinii, czyli treści, które zawierają szczegółową analizę i oryginalne badania napisane przez ekspertów lub entuzjastów dobrze znających dany temat.
System różnorodności witryn
System różnorodności witryn dba o to, aby w naszych najważniejszych wynikach wyszukiwania nie wyświetlać więcej niż 2 strony z tej samej witryny, dzięki czemu żadna z witryn nie dominuje w tych wynikach. Jeśli jednak nasze systemy określą, że jest to szczególnie istotne w przypadku danego wyszukiwania, możemy wyświetlić więcej niż 2 strony. Różnorodność witryn zasadniczo traktuje subdomeny jako część domeny głównej. IE: strony z subdomeny (subdomena.example.com) i domeny głównej (example.com) będą traktowane jako pochodzące z tej samej witryny. Czasami jednak subdomeny są traktowane jako osobne witryny ze względów związanych z różnorodnością.
Systemy wykrywania spamu
Nikt nie chce, aby jego skrzynka odbiorcza była pełna spamu. Dlatego filtry spamu są tak przydatne. Podobnie jest w wyszukiwarce – ponieważ w internecie jest mnóstwo spamu, jeśli nie rozwiążemy tego problemu, nie będziemy mogli wyświetlać najbardziej przydatnych i trafnych wyników. Stosujemy szeroki zakres systemów wykrywania spamu, w tym SpamBrain, aby radzić sobie z treściami i zachowaniami, które naruszają nasze zasady dotyczące spamu. Te systemy są stale aktualizowane, aby odzwierciedlać najnowsze trendy w rozwoju spamu.
Systemy wycofane
Systemy wymienione poniżej zostały podane w celach historycznych. Zostały one zintegrowane z nowszymi systemami lub stały się częścią naszych podstawowych systemów rankingowych.
System przydatnych treści
Ogłoszony w 2022 r. jako „Aktualizacja dotycząca przydatnych treści” to system stworzony z myślą o tym, aby użytkownicy widzieli w wynikach wyszukiwania oryginalne, pomocne treści napisane przez ludzi dla ludzi, a nie treści stworzone głównie po to, by zyskać ruch z wyszukiwarki. W marcu 2024 r. system ewoluował i stał się częścią naszych podstawowych systemów rankingowych, ponieważ korzystają one z różnych sygnałów i systemów, aby przedstawiać użytkownikom przydatne wyniki.
Koliber
Było to znaczące ulepszenie naszych ogólnych systemów rankingowych, które wprowadziliśmy w sierpniu 2013 r. Od tamtej pory nasze systemy rankingowe ewoluują, podobnie jak przedtem.
System Panda
System ten został opracowany, aby zapewnić wyświetlanie w wynikach wyszukiwania treści oryginalnych i wysokiej jakości. Ogłoszony w 2011 roku i nazwany „Panda” ewoluował i stał się jednym z naszych podstawowych systemów rankingowych w 2015 roku.
System Pingwin
System ten został opracowany, aby zwalczać spamowanie linkami. Ogłoszony w 2012 r. i nazwany „aktualizacją Pingwin, został zintegrowany z naszymi podstawowymi systemami rankingowymi w 2016 roku.