Przewodnik po systemach rankingowych wyszukiwarki Google

Google korzysta z automatycznych systemów rankingowych, które uwzględniają wiele czynników i sygnałów z setek miliardów stron internetowych i innych treści w naszym indeksie wyszukiwarki, aby w ułamku sekundy prezentować najbardziej trafne i przydatne wyniki. Na tej stronie znajdziesz wskazówki, które pomogą Ci poznać niektóre z najbardziej wartościowych systemów rankingowych. Przedstawiamy tutaj niektóre systemy będące częścią naszych najważniejszych systemów rankingowych, które są podstawowymi technologiami generującymi wyniki wyszukiwania w odpowiedzi na zapytania. Omawiamy też niektóre systemy powiązane z określonymi potrzebami dotyczącymi rankingu.

Nasze systemy rankingowe zostały zaprojektowane tak, aby działały na poziomie strony i określały pozycję poszczególnych stron w rankingu, wykorzystując różne sygnały i systemy. Do lepszego rozumienia stron przez Google przyczyniają się również sygnały i klasyfikatory dotyczące całej witryny. Sygnały świadczące o dobrej jakości całej witryny nie oznaczają, że jej wszystkie treści będą zawsze zajmować wysokie pozycje. Z kolei słabe sygnały dotyczące całej witryny nie oznaczają, że jej wszystkie treści będą pojawiać się na niskich pozycjach.

Ulepszając nasze systemy rankingowe, stale poddajemy je rygorystycznym testom i ocenom. Informujemy o aktualizacjach naszych systemów rankingowych, gdy wprowadzone zmiany mogą mieć znaczenie dla twórców treści i innych użytkowników.

Możesz też odwiedzić stronę Jak działa wyszukiwarka, aby dowiedzieć się, jak nasze systemy rankingowe w połączeniu z innymi procesami współpracują ze sobą, aby wyszukiwarka Google mogła spełniać misję porządkowania informacji z całego świata oraz udostępniania ich do ogólnego użytku.

BERT

Dwukierunkowe reprezentacje enkodera z transformatorów (BERT) to system AI, który pozwala Google zrozumieć, jak kombinacje słów wyrażają różne znaczenia i intencje.

Systemy informacji kryzysowych

Opracowaliśmy systemy, które przekazują przydatne i aktualne informacje w czasie kryzysu – dotyczy to zarówno osobistych sytuacji kryzysowych, jak i klęsk żywiołowych czy innych sytuacji kryzysowych o dużym zasięgu.

  • Kryzys osobisty: nasze systemy sprawdzają, czy użytkownicy szukają informacji o osobistych sytuacjach kryzysowych. W razie wykrycia zapytań związanych z samobójstwami, przemocą seksualną, otruciem, przemocą na tle tożsamości płciowej lub uzależnieniem od narkotyków wyświetlamy numery infolinii oraz treści od zaufanych organizacji. Dowiedz się więcej o wyświetlaniu w wyszukiwarce Google informacji o osobistych sytuacjach kryzysowych.
  • Powiadomienia SOS: w czasie klęsk żywiołowych i rozległych sytuacji kryzysowych nasz system powiadomień SOS wyświetla komunikaty od władz lokalnych, krajowych lub międzynarodowych. Te powiadomienia mogą obejmować np. alarmowe numery telefonów i strony internetowe, mapy, tłumaczenia przydatnych wyrażeń czy informacje o możliwościach przekazania darowizny. Dowiedz się więcej o tym, jak działają powiadomienia SOS jako element ostrzeżeń o wydarzeniach kryzysowych Google, które są przydatne w przypadku powodzi, pożarów, trzęsień ziemi, huraganów i innych katastrof.

Systemy deduplikacji

Wyszukiwarka Google może znajdować tysiące, a nawet miliony stron internetowych pasujących do zapytania. Niektóre z nich mogą być do siebie bardzo podobne. Aby uniknąć niepotrzebnego powielania treści, nasze systemy w takich przypadkach wyświetlają tylko te wyniki, które są najbardziej trafne. Dowiedz się więcej o tym, jak działa deduplikacja i jak w razie potrzeby wyświetlić pominięte wyniki.

Deduplikacja jest stosowana również w przypadku fragmentów z odpowiedzią. Jeśli strona internetowa zostaje użyta do wyświetlenia fragmentu z odpowiedzią, nie pojawia się równocześnie na pierwszej stronie wyników wyszukiwania. Zwiększa to przejrzystość wyników i ułatwia znajdowanie przydatnych informacji.

System domen o dopasowaniu ścisłym

Jednym z wielu czynników uwzględnianych przez nasze systemy rankingowe i pomagających określić, czy treść pasuje do wyszukiwania, są słowa w nazwach domen. Nasz system domen o dopasowaniu ścisłym działa jednak tak, aby nie przypisywać zbyt dużego udziału treściom przechowywanym w domenach, które zostały zaprojektowane po to, aby dokładnie pasowały do określonych zapytań. Ktoś może np. utworzyć nazwę domeny zawierającą słowa „najlepsze-miejsca-na-obiad”, licząc na to, że w ten sposób uzyska wyższą pozycję treści w rankingu. Nasz system dostosowuje się do takich sytuacji.

Systemy zapewniania aktualności

Stosujemy różne systemy typu „zapytanie zasługuje na aktualność”, zaprojektowane tak, aby dla zapytań, w przypadku których jest to oczekiwane, wyświetlać bardziej aktualne treści. Jeśli na przykład ktoś szuka informacji o filmie, który właśnie wszedł na ekrany, najprawdopodobniej interesują go najnowsze recenzje, a nie starsze artykuły z czasu początku produkcji. Inny przykład: zwykłe wyszukanie hasła „trzęsienie ziemi” może zwrócić informacje o przygotowaniu i zasobach. Jeśli jednak trzęsienie ziemi miało miejsce niedawno, mogą pojawić się artykuły informacyjne i bardziej aktualne treści.

Stosujemy różne systemy analizujące to, jak poszczególne strony się ze sobą łączą. Pozwala to określać, czego dotyczą poszczególne strony i które z nich mogą być najbardziej przydatne w odpowiedzi na dane zapytanie. Jednym z naszych podstawowych systemów rankingowych używanych od początku istnienia Google jest PageRank. Jeśli chcesz dowiedzieć się więcej, przeczytaj oryginalny artykuł badawczy na temat PageRank i zapoznaj się z patentem. Funkcja PageRank nieustannie się zmienia i nadal jest częścią naszych podstawowych systemów rankingowych.

Systemy wiadomości lokalnych

Mamy systemy, które identyfikują i wyświetlają lokalne źródła wiadomości, gdy wyniki z nich są trafne, np. za pomocą funkcji „Najważniejsze artykuły” i „Wiadomości lokalne”.

MUM

Wielozadaniowy Ujednolicony Model (MUM) to system AI, który rozumie i potrafi generować tekst. Obecnie nie używamy go do określania pozycji w rankingu w wyszukiwarce, ale do konkretnych zastosowań, takich jak ulepszanie wyszukiwania informacji na temat szczepionek przeciw COVID-19ulepszanie wyświetlanych przez nas objaśnień do fragmentów z odpowiedzią.

Dopasowywanie neuronowe

Dopasowywanie neuronowe to system AI, dzięki któremu Google interpretuje koncepcje w zapytaniach i na stronach oraz dopasowuje je do siebie.

Systemy oryginalnych treści

Mamy systemy pomagające wyświetlać na wyższych pozycjach wyników wyszukiwania oryginalne treści (w tym materiały autorskie), a nie strony, które je tylko cytują. Obejmuje to obsługę specjalnych znaczników strony kanonicznej, których twórcy mogą użyć, aby wskazać wyszukiwarce, która strona jest stroną główną, jeśli została ona zduplikowana w kilku miejscach.

Systemy przesuwania w dół na podstawie usunięć

Zasady Google zezwalają na usuwanie określonych typów treści. Jeśli przetwarzamy dużą liczbę próśb o usunięcie treści z konkretnej witryny, wykorzystujemy to jako sygnał do ulepszenia wyników wyszukiwania. W szczególności:

  • Usuwanie treści ze względów prawnych: 如果收到大量涉及特定网站的有效版权内容移除要求我们会据此降低该网站中其他内容在搜索结果中的排名。这样,如果存在其他侵权内容,用户更可能看到原创内容,而非相应侵权内容。对于涉及诽谤、仿冒商品和法院命令移除的投诉,我们会采用类似的降位衡量因素。对于儿童性虐待内容 (CSAM),我们一经发现即会将其移除,并会降低儿童性虐待内容 (CSAM) 占比非常高的网站中所有内容的排名。
  • Usuwanie danych osobowych: Jeśli przetwarzamy usuwanie dużej ilości danych osobowych z witryny z uciążliwymi zasadami usuwania treści, inne treści z tej witryny w wynikach przesuwamy w dół. Sprawdzamy również, czy ten sam schemat działania występuje w innych witrynach, a jeśli tak, przesuwamy w dół treści w tych witrynach. Podobne praktyki przesuwania w dół możemy stosować w przypadku witryn, w których występuje dużo usunięć treści takich jak doxing, niecenzuralne zdjęcia osób zrobione lub udostępnione bez zgody; niecenzuralne fałszywe treści publikowane bez zgody.

System decydujący o pozycji fragmentu w rankingu

Ranking fragmentów to system AI, który służy do identyfikowania poszczególnych sekcji („fragmentów”) na stronie w celu lepszego rozpoznania, jak trafna jest dana strona.

RankBrain

RankBrain to system AI, który pomaga wyszukiwarce zrozumieć, jak słowa wiążą się z koncepcjami. Oznacza to, że wyszukiwarka może trafniej dopasowywać treści, nawet jeśli nie zawierają one dokładnie wszystkich słów użytych w wyszukiwaniu, ponieważ wie, że dane treści są powiązane z innymi słowami i pojęciami.

Systemy rzetelnych informacji

Aby pokazywać najbardziej wiarygodne informacje, korzystamy z kilku systemów działających na różne sposoby. Pomagają one wyświetlać na czołowych miejscach bardziej wiarygodne strony i przesuwać treści o niskiej jakości w dół oraz promują dziennikarstwo wysokiej jakości. Gdy brak wiarygodnych informacji, w przypadku szybko zmieniających się tematów oraz wtedy, gdy nie mają pewności co do ogólnej jakości wyników danego wyszukiwania, nasze systemy automatycznie wyświetlają ostrzeżenia dotyczące treści. Zawierają one wskazówki, jak uzyskać wyniki, które mogą być bardziej przydatne. Dowiedz się więcej o naszym podejściu do udostępniania wysokiej jakości informacji w wyszukiwarce.

System opinii

System opinii ma na celu skuteczniejsze nagradzanie wysokiej jakości opinii, czyli treści, które zostały utworzone przez ekspertów lub entuzjastów dobrze znających dany temat i zawierają szczegółową analizę oraz wnioski z oryginalnych badań.

System różnorodności witryn

System różnorodności witryn dba o to, aby żadna z witryn nie zdominowała naszych najważniejszych wyników wyszukiwania. Pozwala w nich wyświetlać maksymalnie 2 strony z tej samej witryny. Jeśli jednak nasze systemy określą, że jest to szczególnie istotne w przypadku danego wyszukiwania, możemy wyświetlić więcej niż 2 strony. System różnorodności witryn zasadniczo traktuje subdomeny jako część domeny głównej. IE: strony z subdomeny (subdomena.example.com) i domeny głównej (example.com) będą traktowane jako pochodzące z tej samej witryny. Czasami jednak ze względów związanych z różnorodnością traktujemy subdomeny jako osobne witryny.

Systemy wykrywania spamu

Nikt nie chce, aby jego skrzynka odbiorcza była pełna spamu. Dlatego filtry spamu są tak przydatne. Podobnie jest w wyszukiwarce. Ponieważ w internecie jest mnóstwo spamu, jeśli nie rozwiążemy tego problemu, nie będziemy mogli wyświetlać najbardziej przydatnych i trafnych wyników. Aby radzić sobie z treściami i zachowaniami, które naruszają nasze zasady dotyczące spamu, stosujemy szeroki zakres systemów wykrywania spamu, w tym SpamBrain. Są one stale aktualizowane, aby odzwierciedlać najnowsze trendy w rozwoju spamu.

Systemy wycofane

Systemy wymienione poniżej zostały podane w celach historycznych. Zostały one zintegrowane z nowszymi systemami lub stały się częścią naszych podstawowych systemów rankingowych.

System przydatnych treści

System „Aktualizacja dotycząca przydatnych treści” ogłoszony w 2022 r. pomaga wyświetlać w wynikach wyszukiwania oryginalne, pomocne treści napisane przez ludzi dla ludzi, a nie treści stworzone głównie po to, żeby zyskać ruch z wyszukiwarki. W marcu 2024 r. system ewoluował i stał się częścią naszych podstawowych systemów rankingowych, ponieważ korzystają one z różnych sygnałów i systemów, aby przedstawiać użytkownikom przydatne wyniki.

Koliber

Było to ważne ulepszenie naszych ogólnych systemów rankingowych, które wprowadziliśmy w sierpniu 2013 r. Od tamtej pory nasze systemy rankingowe ewoluują, podobnie jak przedtem.

System Panda

System ten został opracowany, aby zapewnić wyświetlanie w wynikach wyszukiwania treści oryginalnych i wysokiej jakości. Ogłoszony w 2011 roku i nazwany „Panda” ewoluował i stał się jednym z naszych podstawowych systemów rankingowych w 2015 roku.

System Pingwin

System ten został opracowany, aby zwalczać spamerskie linki. Ogłoszony w 2012 r. i nazwany „aktualizacją Pingwin” został zintegrowany z naszymi podstawowymi systemami rankingowymi w 2016 roku.