Um grande vazamento no início desta semana abriu uma das principais caixas-pretas da internet: o Search Engine Optimization (SEO), ou Otimização para motores de busca, em tradução livre. O sistema do Google define quais páginas estarão no topo do buscador mais popular do mundo.
O funcionamento do SEO da gigante de Mountain View veio à tona em um documento de quase 2,6 mil páginas publicado por Rand Fishkin e Mike King, especialistas em SEO. Eles revelaram que as informações estavam no GitHub e foram repassadas pelo leaker Erfan Azimi, que queria explanar as "mentiras" sobre o algoritmo de buscas.
O assunto sempre foi um segredo guardado a sete chaves, já que o Google defendia que atores maliciosos poderiam se valer das informações para ranquear bem nas buscas.
De fato, a justificativa até faz certo sentido. Contudo, o que mostram os documentos é que o Google se contradisse ou no mínimo deu informações imprecisas sobre como o site de pesquisas funciona.
Por que o assunto SEO é importante?
Muitos dados contidos no arquivo de quase 2,6 mil páginas sobre o SEO do Google são bastante técnicos. Por causa disso, a leitura e interpretação têm sido feita por especialistas da área.
O fato, porém, é que o vazamento mudará o entendimento sobre as engrenagens do principal buscador da internet. A questão é importante porque milhões de páginas mundo afora dependem de uma boa classificação para se manter relevante, gerar tráfego e consequentemente se monetizarem.
Muitos especialistas argumentam que o poder do Google é tão grande – já que teoricamente ele é a portaria da internet –, que o sistema poderia até ser entendido como um serviço público. De maneira prática, o buscador pode sumir com páginas importantes de interesse público, enquanto dá evidência a conteúdos menos relevantes.
E apesar de não ser possível saber o quão atual é a classificação de SEO mostrada pelos dados, o fato é que em algum momento o Google Search tem ou teve pelo menos 14 mil indicadores para ranquear os sites na internet.
Dentro deste número gigantesco de parâmetros analisados estão a autoridade da página em determinado assunto, tamanho, número de cliques, palavras-chaves e muito mais. A granularidade é tão grande que torna bastante complexo o objetivo de entender as regras do jogo do SEO.
E para embaralhar ainda mais a mente dos especialistas em SEO, o vazamento sugere que o buscador estava sim fazendo algumas coisas que o Google havia dito que não.
Um dos principais exemplos é que o buscador aparentemente ranqueia páginas utilizando dados dos sites como número de cliques e dados dos usuários do Chrome. Anteriormente, representantes do Google afirmaram que estas informações não eram levadas em consideração.
Além disso, outro ponto importante é que o leak mostra que, contrariando o que o Google havia dito, um site popular com bastante acessos pode "furar fila" e ser mostrado primeiro no ranking de buscas em detrimento a sites desconhecidos, mesmo que eles tenham informações de pior qualidade.
Quais as revelações sobre o vazamento do SEO do Google?
O vazamento do SEO do Google pode ser apenas a ponta do iceberg, já que certamente o sistema ainda possui muitos segredos.
Apesar disso, as revelações municiam de argumentos aqueles que defendem vias mais democráticas e acessíveis de acesso às regras da "portaria da internet".
Confira, a seguir, algumas das principais revelações sobre o vazamento do SEO do Google:
- O Google Search pode definir um número máximo de páginas ou postagens de um site que aparecerão no buscador;
- Diferente do que havia dito anteriormente, as Taxas de cliques (CTR) e tempo de permanência dos usuários em uma página são sim métricas para definir o ranqueamento dos sites no Google;
- O buscador do Google possui classificadores específicos sobre temas sensíveis como eleições, indicando que a classificação pode também levar em consideração o teor político dos sites;
- O buscador do Google tem uma pontuação de autoridade geral para os sites, identificada como "siteAuthority". Anteriormente, a big tech havia negado a existência de uma "autoridade de domínio geral";
- O buscador do Google utiliza dados coletados pelo Google Chrome – como visualizações de páginas através do navegador – para ranquear os sites. O Google já havia dito que não utilizava dados do software para isso;
- Conteúdos podem ser despriorizados no topo da busca por conterem informações como links que não correspondem ao site alvo, links de pornografia, insatisfação do usuário e mais;
- O Google possui um histórico com a cópia de cada versão de cada página que já foi indexada pelo buscador e, com isso, o Search pode se lembrar de cada alteração já realizada. Apesar disso, ele analisa somente 20 alterações em uma URL quando está analisando os links;
- Os sites indexados pelo Google são avaliados em relação ao tempo em que eles estão no ar, ou seja, de acordo com a longevidade na internet. O comando "hostAge" é o responsável por isso;
- O Google foi, no mínimo, impreciso em relação à diretriz EEAT (Experiência, Especialização, Autoridade e Confiabilidade, em português) para os sites. A empresa disse que a diretriz serviria somente para melhorar a experiência do usuário, mas aparentemente utiliza esses dados também para ranquear as páginas.
O que diz o Google?
O Google confirmou a veículos como o The Verge que o vazamento é real. Contudo, um porta-voz da big tech defendeu que não é possível tirar conclusões precisas acerca dos dados expostos publicamente.
"Nós deixamos um alerta sobre fazer suposições imprecisas sobre a Pesquisa [do Google] com base em informações fora de contexto, desatualizadas ou incompletas", afirmou o porta-voz Davis Thompson.
"Nós compartilhamos informações extensas sobre como a Pesquisa funciona e os tipos de fatores que nossos sistemas pesam, ao mesmo tempo em que trabalhamos para proteger a integridade de nossos resultados da manipulação", concluiu.
SparkToro GizModo iPullRank The Verge Business Insider