Como o Google combateu o spam na Pesquisa em 2020

Quinta-feira, 29 de abril de 2021

O Googlebot e a aranha indexadora leem o relatório de spam na Web 2020

A Pesquisa Google é uma ferramenta eficiente que ajuda você a encontrar informações úteis na Web aberta. Infelizmente, nem todas as páginas da Web são criadas com boas intenções. Muitas delas são feitas explicitamente para enganar as pessoas, e isso é algo que combatemos todos os dias. Para garantir a segurança e proteger sua experiência contra conteúdos nocivos e comportamentos maliciosos, a Pesquisa investiu em várias inovações em 2020.

Combate mais inteligente ao spam

Já estamos na luta contra o spam desde o início da Pesquisa, mas os avanços recentes da inteligência artificial (IA) têm um potencial inédito para revolucionar nossa abordagem.

Combinando nosso conhecimento profundo de spam com a IA, no ano passado, conseguimos criar nossa própria IA de combate especializada, que é muito eficaz para detectar tendências de spam novas e conhecidas. Por exemplo, reduzimos sites com conteúdo gerado automaticamente e copiado em mais de 80% em comparação a alguns anos atrás.

O spam de sites invadidos ainda era um grande problema em 2020, já que o número de sites vulneráveis continuava alto, apesar de melhorarmos nosso recurso de detecção em mais de 50% e removermos a maior parte desse tipo de spam dos resultados da pesquisa.

Esse é um problema que não podemos resolver sozinhos. Mesmo que fosse possível detectar e proteger os sites contra todos os tipos de spam, os hackers continuariam a explorar as brechas até que fossem todas fechadas. Os proprietários podem proteger os sites ao manter um bom nível de segurança. É mais fácil prevenir a invasão do que se recuperar dela. O Google oferece recursos para ajudar você a entender as formas mais comuns de invasão de sites e saber como usar o Search Console para ver se o site foi invadido. Confira e faça sua parte por uma Web mais segura.

Com os grandes acontecimentos do ano passado, que incluíram até uma pandemia, nos dedicamos muito a ampliar essa proteção aos bilhões de pesquisas que recebemos sobre tópicos importantes. Na hora de procurar um local de testes de COVID-19 na sua região, não é certo ter que se preocupar com spam de conteúdo sem sentido, que pode redirecionar você a sites de phishing. Além de eliminar conteúdo com spam, trabalhamos com várias outras equipes da Pesquisa para garantir que você receba as informações mais atualizadas e de maior qualidade quando e onde for mais importante.

Barreiras para o spam não chegar até você

Antes de exibir um conjunto de resultados da pesquisa no Google, muita coisa acontece nos bastidores. Encontramos, rastreamos e indexamos bilhões de páginas da Web todos os dias. Entre essas páginas, há muito spam. Diariamente, descobrimos 40 bilhões de páginas com esse problema. Veja a seguir o que fazemos para impedir que o spam interfira na sua busca por informações relevantes e úteis.

Como nos protegemos contra o spam em todas as etapas
Esse diagrama conceitualiza a forma como nos protegemos contra o spam.

Primeiro temos sistemas que podem detectar o spam ao rastrear páginas ou outros conteúdos. O rastreamento ocorre quando nossos sistemas automáticos visitam o conteúdo e o consideram para inclusão no índice que usamos para fornecer os resultados da pesquisa. Alguns conteúdos são detectados como spam e não são adicionados ao índice.

Esses sistemas também funcionam para o conteúdo que descobrimos nos sitemaps e com o Search Console. Por exemplo, o Search Console tem o recurso Solicitar indexação para que os criadores de conteúdo possam nos informar sobre novas páginas que precisam ser adicionadas rapidamente. Alguns criadores de spam invadiram sites vulneráveis, fingiram ser os proprietários desses sites, verificaram a identidade no Search Console e usaram a ferramenta para pedir ao Google o rastreamento e a indexação das páginas com spam criadas por eles. Usamos a IA para identificar verificações suspeitas e impedir a entrada de URLs com spam no nosso índice dessa forma.

Em seguida, temos sistemas que analisam o conteúdo incluído no nosso índice. Quando você faz uma pesquisa, eles conferem se as correspondências encontradas podem ser spam. Nesse caso, elas não aparecerão nos principais resultados da pesquisa. Também usamos essa informação para melhorar nossos sistemas e impedir que esse tipo de spam seja incluído no índice.

Como resultado, há muito pouco spam nos principais resultados da pesquisa, graças aos nossos sistemas automatizados com o apoio da IA. Estimamos que esses sistemas automatizados ajudam a manter mais de 99% das visitas da Pesquisa totalmente livres de spam. Quanto ao pequeno percentual restante, nossas equipes realizam ações manuais e usam esses aprendizados para melhorar ainda mais os sistemas automatizados.

Proteção além do spam

O Googlebot e a indexadora protegendo você além do spam

Além do spam, ampliamos nossas iniciativas em 2020 para proteger você contra outros tipos de abuso. Vários deles podem causar danos financeiros e pessoais significativos.

Em 2020, fizemos melhorias consideráveis na nossa cobertura e protegemos mais usuários contra fraudes e golpes on-line. Há vários tipos de golpes on-line, e eles podem afetar você negativamente de mais formas do que o spam tradicional na Web. Por exemplo, muitos golpistas fingem oferecer números de telefone do suporte ao cliente para serviços e produtos conhecidos, com o intuito de enganar os usuários que ligam para fazer pagamentos por transferências bancárias ou vales-presente. O chamado "golpe do suporte ao cliente" ou "golpe do suporte técnico" foi denunciado por centenas de milhares de usuários, que chegam a perder centenas de dólares de uma só vez para os golpistas.

Exemplo de golpe do suporte ao cliente nos resultados da pesquisa

Desde 2018, nossos sistemas protegeram centenas de milhões de pesquisas por ano ao detectar sites que podem conter golpes. Na Web, os golpistas tentaram criar vários sites de baixa qualidade com excesso de palavras-chave, logotipos das marcas que eles imitam e um número de telefone para que você ligue. Com nossas soluções algorítmicas, é pouco provável que golpes e fraudes sejam exibidos nos resultados da pesquisa. Essa é uma das várias proteções que lançamos no ano passado para garantir a qualidade dos resultados da pesquisa e sua segurança. Nossa missão é estar sempre à frente dos desafios para mostrar os resultados mais confiáveis. Ao mesmo tempo, você também pode se proteger melhor ao acompanhar as novidades e saber mais sobre os golpes.

Os avanços em IA também ajudaram muito na compreensão do conteúdo dos sites. Um exemplo disso é como melhoramos o método de classificação dos sites de avaliações de produtos, informativos e de compras. A Pesquisa Google é uma ótima maneira de pesquisar e encontrar produtos antes de fazer uma compra. Queremos garantir que você receba as informações mais úteis para sua próxima compra ao recompensar conteúdo com uma pesquisa mais detalhada e informações úteis.

Apesar dos avanços significativos nas nossas iniciativas de combate, os criadores de spam estão sempre em busca de novas técnicas para escapar da detecção. Trabalhamos continuamente para melhorar e proteger os usuários contra novos tipos de abuso, e as denúncias externas podem ajudar nisso. Você teve experiências recentes na Pesquisa em que sentiu que o conteúdo era enganoso, foi vítima de um golpe ou recebeu spam? Na sua opinião, podemos melhorar para evitar isso? Se sim, envie seu feedback usando o relatório de spam. Inclua também sua consulta e outras informações que possam ser úteis.

O Googlebot ajudando você a combater o spam