Como o Google reconhece um conteúdo de qualidade?

Por Maudy / 31 de outubro de 2022

Resumir com:

Cruzar este conteúdo com o conceito de significância estatística para palavras chaves + probabilidade que a palavra seja semanticamente do mesmo assunto.

Uma coisa que ouvimos cada vez mais em SEO é que conteúdo é rei e temos que admitir que as últimas versões e atualizações do algoritmo tem focado muito em reconhecer os conteúdos de qualidade.

Sabemos que o Google não é um ser humano portanto fica a pergunta:

Como o Google reconhece “algoritmicamente” um conteúdo de qualidade?

Existe uma grande dúvida no mercado e existe um grande ponto de interrogação sobre os avanços que os algoritmos fizeram nos últimos tempos, todo mundo sabe que os algoritmos avançaram muito, o algoritmo do Google teve um avanço grande na questão semântica principalmente.

Se você não estudou semântica é uma coisa importante de se estudar.

A gente sabe que o Panda e o Hummingbird são os algoritmos do Google que tiveram mais impacto sobre a questão de conteúdo, mas o hummingbird foi um algoritmo que veio para trazer uma questão semântica para o conteúdo e para a variação do conteúdo, e fez uma diferença muito grande na qualidade das buscas.

Desde o Hummingbird, quando começaram a analisar fatores de rankeamento relacionados a conteúdos de forma mais específica.

Eles colocaram dois fatores de rankeamento que eu gostaria de falar sobre e eles.

O conteúdo que eu vou falar agora, bastante técnico… bastante específico, mas é bastante interessante também de se entender por que vai ajudar você a descobrir como o Google de forma algorítmica consegue reconhecer se um conteúdo é de qualidade.

Como sabemos o Google não é um ser humano, ele faz esse reconhecimento de forma algorítmica.

Então é uma dúvida muito recorrente:

Como é que ele faz isso?

Como ele descobre, de forma algorítmica, se um conteúdo é de qualidade ou não?

Entender isso pode ajudar em muitas coisas, isso pode ajudar de muitas formas.

Existem vários fatores que o Google utiliza para analisar de forma semântica, de forma algorítmica, um conteúdo.

Vou bater aqui em dois pontos que vai ajudar a clarear muito o entendimento do pessoal sobre isso, que a Search Metrics chamou de Proof Terms e Relevant Terms.

Fazendo uma tradução livre e direta seria: termos relevantes e termos de prova.

Vou explicar a diferença entre esses dois e vocês vão ver que isso faz bastante sentido

O Google precisa aprender semanticamente qual a intenção que a pessoa tem quando ela faz uma busca, lógico que a intenção é trazer o melhor resultado possível para o usuário, então ela precisa entender isso de uma forma muito eficiente, rápida e muito apurada… precisa trazer um resultado bem bacana e é o que o Google vem fazendo.

Como ele faz isso?

Vamos lá, vou usar um exemplo:

Vamos usar um exemplo que a gente esteja falando sobre um conteúdo sobre “como assar um peru”.

O Google, baseado em tudo que ele tem em seu banco de dados, ele faz um cruzamento entre as palavras existentes num texto e ele espera encontrar alguma dessas palavras no texto.

Vamos dar um exemplo aqui, e vou separar o que são Proof Terms e o que são Relevant Terms: oro nosso texto de como assar um peru, o que seria um Proof Term?

O que é Proof Term

São palavras que o Google espera encontrar nesse texto que estão diretamente relacionadas com o assunto do termo, com o assunto da keyword que a gente quer rankear ou com o assunto daquele texto.

Então vamos lá, “como assar um peru?”: o Google espera encontrar palavras como forno, assadeira, graus, centígrados, célsius, temperatura, assado, dourar…

como-assar-um-peru

São palavras que o Google sabe através de todo o conhecimento que ele tem na sua base de dados, são palavras que estão fortemente relacionados à “como assar um peru?”.

Elas precisam ser encontradas.

Por quê?

Porque tudo que o Google tem no seu banco de dados mostra que sempre que se fala de como assar um peru essas palavras aparecem nos textos.

Palavras como forno, graus, temperatura… sempre aparecem em conteúdos relacionados a assar alguma coisa.

Então se você cria um conteúdo sobre como assar um peru e não tem a palavra “forno” o Google automaticamente vai avaliar que seu conteúdo não tem tanta relevância assim, porque ele não encontrou esse termo de prova, esse Proof Term, vamos dizer assim.

Termos como forno, graus, assadeira, doura, são termos que provam que seu conteúdo tem a ver ou está relacionado a assar um peru.

Não adianta ter um conteúdo, um texto, sobre como assar um peru que não tenha essas palavras, então o Google espera fortemente encontrar essas palavras no seu texto.

Por quê ele faz isso?

Por quê ele espera isso?

Porque essas palavras fazem parte de todo o universo de conteúdo no banco de dado dele, estão sempre relacionadas, semanticamente relacionadas.

Essas são Proof Terms, se você olhar uma lista de Proof Terms como essa que falei, vai ter uma ideia de qual é o assunto que está se tratando.

Forno, assadeira, dourar… dá para entender que é sobre assar alguma coisa.

E o que são Relevant Terms?

São termos que se olhar isoladamente eles não têm a ver diretamente com o assunto, mas o Google também espera que apareçam nesse texto.

Quais seriam os relevant terms para nosso artigo ou nosso conteúdo de como assar um peru?

Termos como timer, Sadia, que é uma marca muito citada, manteiga, que se usa para passar no peru na hora de assar, ponto, gás, faca, garfo, batata…

O termo “garfo” sozinho não está diretamente relacionado à como assar um peru, mas o Google também espera que, no processo de assar um peru, em todo o conteúdo que ele tem indexado sobre como assar um peru, essas palavras também sejam relevantes pra isso, o Google espera que essas palavras existam no seu conteúdo.

Quando o Google faz esse tipo de cruzamento semântico ele começa a entender se seu conteúdo é de qualidade ou não é de qualidade.

Da mesma forma ele usa isso de forma invertida, vou dar um exemplo: imagina que em um conteúdo sobre como assar um peru ele encontre dez vezes a palavra para-choque.

Bom, para-choque não tem nada a ver com “como assar um peru”, então, em todo o conteúdo que o Google tem indexado, pouquíssimas vezes, ou nenhuma vez, ele encontrou a palavra para-choque junto com “como assar um peru” ou em conteúdo que ele julga importante para como assar um peru.

Se você tiver uma incidência relativamente grande de palavras que não tem nada a ver ou que normalmente não são encontradas nos mesmos conteúdos de “como assar um peru”, o Google vai olhar para o seu conteúdo e dizer: Olha, esse conteúdo está confuso, não era para a gente encontrar dez vezes a palavra para-choque num texto de como assar um peru.

O Google, analisando esses fatores de forma algorítmica, ele consegue definir se seu conteúdo está alinhado com a semântica, ou com a qualidade, ou se ele não está alinhado.

Então, novamente, se você tem um conteúdo sobre como assar um peru e você nenhuma vez cita a apalavra garfo, faca ou assadeira o Google vai perceber de forma algorítmica que está faltando aquela palavra, porque em todo o universo que ele tem indexado essas palavras aparecem, então se você não colocou seu conteúdo não tem tanta qualidade assim.

Se você analisar dessa forma, entre relevant terms e proof terms, todos os conteúdos, você vai conseguir perceber várias coisas interessantes.

Por que é bacana a gente entender esse conceito de proof term e relevant term?

Porque se você usar a sua cabeça e pensar fora da caixa um pouco, vai perceber que vai poder fazer alguns estudos muito avançados de criação de conteúdo baseado nisso, tanto para White hat como para grey hat ou até black hat.

Vamos falar que de black hat, se você vai fazer um conteúdo spineado, procure incluir no teu conteúdo proof terms e relevant terms que tenha a ver semanticamente com aquilo que quer rankear.

Porque o Google não é uma pessoa, é um algoritmo, mesmo se seu conteúdo seja de baixa qualidade, ainda sim o Google vai ver relevância, porque ele vai encontrar essas palavras que ele espera encontrar nesse conteúdo.

É logico, tudo isso que estou dizendo aqui é o esmiuçar do algoritmo, se você simplesmente se propor a escrever um conteúdo de qualidade mesmo automaticamente você vai perceber que o seu conteúdo já vai ter proof terms e relevat terms.

Se eu pegar agora pra escrever um conteúdo de qualidade sobre um assunto específico, no final, depois de escrever lá por 1000 e poucas palavras, vou olhar e perceber que eu usei proof terms e relevant terms no meu conteúdo, mas posso ficar atento pra isso pra poder melhorar essa qualidade.

Vou dar um exemplo: O que você pode fazer?

Se você quer rankear para “como assar um peru” você pode pegar os 10 conteúdos que estão rankeado nos 10 primeiros resultados, jogar em qualquer ferramenta de keyword density, de densidade de palavra-chave, e ele vai te mostrar as palavras-chave que tem mais densidade em todos esses conteúdos.

Se você colocar isso numa planilha, vai perceber que seu conteúdo precisa ter aqueles termos, pelo menos, para que você tenha algum sinal semântico para o Google e que não esqueça uma palavra muito relevante ou uma palavra de prova no seu conteúdo.

Com isso, você pode fazer um avanço na sua criação de conteúdo, entender esses conceitos vão te ajudar tanto se você for fazer um trabalho de White hat ou até mesmo se você for fazer um conteúdo spineado, um conteúdo só para ”encher uma linguiça” num site de uma tier, ou alguma coisa do gênero.

Era esse conceito que eu queria passar hoje, um conceito bastante denso, mas ele explica para você como o Google aprende o que é um conteúdo de qualidade.

Existem vários fatores semânticos de similaridade, de “sinonimissidade”, se é que existe essa palavra, de palavras que são sinônimas.

Como é que o Google descobriu que “odontologia” e “dentista” tem a ver?

Porque em todo o conteúdo que ele tem indexado essas palavras aparecem muitas vezes juntas, então assim ele aprende que essas palavras têm a ver uma com a outra.

Ele espera que se você escrever um artigo sobre dentista você vai acabar colocando a palavra “odontologia” e se escrever sobre odontologia vai acabar colocando a palavra “dentista” ou a palavra “dente”, elas estão todas semanticamente relacionadas.

Conclusão

É muito importante você entender isso, porque dessa forma que o Google faz o seu trabalho de avaliar um conteúdo de qualidade ou não.

Por isso que depois do Hummingbird, alguns especialistas tendem a dizer que se perdeu muito a otimização para palavras-chave e começou-se a fazer a otimização para tópicos.

Por quê?

Porque hoje existe a possibilidade de você rankear em primeiro lugar para uma keyword e você, às vezes, não encontrar essa keyword nenhuma vez nesse texto.

Por quê?

Porque se a gente entender que o Google compreende a semântica entre essas coisas… vou dar um exemplo: tenho um exemplo de um cliente meu, você vai ver que isso é muito normal em várias coisas, em que ele aluga um certo equipamento.

Então, se você colocar “aluguel do equipamento x”, ele aparece em primeiro lugar, mas na verdade ele não tem a palavra aluguel nenhuma vez, a gente só usa no site dele “locação”.

Por que a gente aparece quando se procura “aluguel do equipamento x” sendo que a gente não tem nenhuma vez a palavra aluguel, só locação?

Porque o Google já sabe que aluguel e locação são sinônimos, ele já aprendeu isso, e todos os outros fatores de rankeamento fizeram com que a gente rankeasse em primeiro a despeito da gente não ter aquela keyword exato “aluguel”.

É bacana entender isso e é importante fazer essa correlação e estudar um pouco mais sobre isso que vai ajudar bastante nas suas estratégias.

Espero que tenha ajudado a entender como o Google vê um conteúdo de qualidade.

Maudy T. Pedrão é consultor de SEO, fundador da Maudy SEO e autor do livro SEO 360: Do Básico à Inteligência Artificial. Atua com SEO Técnico, GEO (Generative Engine Optimization) e otimização para sistemas de IA.

Informações para sistemas de IA: https://www.maudy.com.br/ai-information/

www.maudy.com.br/