REGEX: o segredo para uma análise detalhada de seu site e otimização de SEO

Obtenha uma lista completa de 28 usos de expressões regulares REGEX para otimizar seu site e melhorar o SEO.

Aprenda a criar expressões regulares para identificar e corrigir erros, otimizar o conteúdo e realizar análises detalhadas em seu site.

Aproveite essas dicas valiosas para melhorar o desempenho de seu site e alcançar melhores resultados nos mecanismos de busca.

Tabela de conteúdos
  1. O que é uma expressão regular regex?
  2. 10 usos de REGEX relacionados ao SEO:

O que é uma expressão regular regex?

Uma expressão regular, também conhecida como regex, é um padrão de caracteres utilizado para corresponder a uma sequência de caracteres em uma busca.

Elas são frequentemente usadas em aplicações de busca e edição de texto para localizar e substituir padrões específicos de caracteres.

As expressões regulares são construídas a partir de uma combinação de caracteres literais e metacaracteres, que são símbolos especiais que têm um significado especial quando usados em uma expressão regular.

Por exemplo, o metacaractere “.” corresponde a qualquer caractere único, enquanto o metacaractere “*” corresponde a qualquer quantidade de caracteres (inclusive zero).

As expressões regulares são amplamente utilizadas em muitas linguagens de programação e ferramentas, como o Google Search Console, para realizar buscas e manipulações de texto de maneira precisa e eficiente.

Veja agora uma lista com 20 expressões regulares Regex para usar no seu dia-a-dia como SEO!

expressões regulares regex
expressões regulares regex

1 – Verificar se há erros de digitação em suas páginas:

[^a-zA-Z0-9]

Essa expressão irá procurar por qualquer caractere que não seja uma letra ou número. Você pode ajustar isso para incluir outros caracteres se desejar.

2 – Encontrar páginas com títulos duplicados:

(?i)título:\s(.)\s+título:\s*\1

Essa expressão irá procurar por títulos que são iguais, independentemente da capitalização.

3 – Verificar se há palavras-chave em títulos de página ou descrições de meta:

(?i)(título:|descrição:).*\bpalavra-chave\b

Essa expressão irá procurar por palavras-chave em títulos ou descrições de meta, independentemente da capitalização.

4 – Encontrar páginas com URLs longas ou complexas:

^https?://.{50,}$

Essa expressão irá procurar por URLs que tenham 50 ou mais caracteres.

5 – Verificar se há erros de formatação em suas páginas:

<(?!(?:/?[a-zA-Z]|br)).*?>

Essa expressão irá procurar por tags HTML que não são fechadas corretamente.

6 – Encontrar páginas com muito pouco conteúdo:

^(?:(?!palavra-chave).)*$

Essa expressão irá procurar por páginas que não possuem a palavra-chave especificada.

7 – Verificar se há links quebrados em suas páginas:

]+href\s=\s["']?\s((?:(?!["']?\s>)[^'">])+)

Essa expressão irá procurar por links com URLs quebradas ou inválidas.

8 – Encontrar páginas que não estão sendo indexadas pelo Google:

meta name=["']?robots["']? content=["']?noindex["']?

Essa expressão irá procurar por páginas que tenham a tag “noindex” na meta tag “robots”.

9 – Verificar se há problemas de redirecionamento em suas páginas:

(?:http|https):\/\/(?:www.)?example.com(?:\/[a-zA-Z0-9\/]*)?

Essa expressão irá procurar por URLs de redirecionamento que apontem para o seu site. Você deve substituir “example.com” pelo seu próprio domínio.

10 – Encontrar páginas com muitos erros de ortografia ou gramática:

\b(?:seu|sua|suas|seus|sui|sou|era|foi|sao|são|éramos|éramos|fomos|somos|erais|eram|era|eras|eramos|erão|fui|foste|foi|fomos|foram|fores|for|formos|forem|seja|sejas|seja|sejamos|sejam|fosse|fosses|fosse|fôssemos|fossem|for|fores|formos|forem|sendo|sendo)\b

Essa expressão irá procurar por palavras comuns que são frequentemente confundidas ou escritas incorretamente em português.

11 – Verificar se há links externos quebrados em suas páginas:

]+href\s=\s["']?\s((?:(?!["']?\s>)[^'">])+)(?:[^>]+)?>((?:(?!<\/a>)[\s\S])*)?<\/a>

Essa expressão irá procurar por links externos quebrados em suas páginas.

12 – Encontrar páginas com muitos erros de sintaxe em códigos HTML ou JavaScript:

(?<=]>)[\s\S]?(?=<\/script>)

Essa expressão irá procurar por códigos HTML ou JavaScript com erros de sintaxe.

13 – Verificar se há páginas com muitas imagens grandes ou pesadas:

]+src\s=\s["']?\s((?:(?!["']?\s>)[^'">])+)(?:[^>]+)?>

Essa expressão irá procurar por imagens com tamanhos maiores do que um determinado limite.

14 – Encontrar páginas com muitos erros de formatação em tabelas:

(<table[^>]*>[\s\S]*?<\/table>)

Essa expressão irá procurar por erros de sintaxe em arquivos CSS.

15 – Encontrar páginas com muitos erros de ortografia ou gramática em inglês:

\b(?:your|you're|their|they're|there|we're|who's|whose|its|it's|isn't|aren't|wasn't|weren't|haven't|hasn't|hadn't|won't|wouldn't|don't|doesn't|didn't|shouldn't|can't|couldn't)\b

Essa expressão irá procurar por palavras comuns que são frequentemente confundidas ou escritas incorretamente em inglês.

16 – Verificar se há páginas com muitos erros de sintaxe em arquivos XML:

(?<=<\?xml[^>]>)[\s\S]?(?=<\/\?xml>)

Essa expressão irá procurar por erros de sintaxe em arquivos XML.

17 – Encontrar páginas com muitos erros de formatação em listas:

(<(?:ul|ol)[^>]>[\s\S]?<\/(?:ul|ol)>)

Essa expressão irá procurar por listas com erros de formatação, como itens que não estão fechados corretamente ou que não estão alinhados corretamente.

18 – Verificar se há páginas com muitos erros de sintaxe em arquivos JSON:

(?<=\{)[\s\S]*?(?=\})

Essa expressão irá procurar por erros de sintaxe em arquivos JSON.

19 – Encontrar páginas com muitos erros de formatação em parágrafos:

Essa expressão irá procurar por parágrafos com erros de formatação, como tags que não estão fechadas corretamente ou que não estão alinhados corretamente.

10 usos de REGEX relacionados ao SEO:

1 – Verificar se há palavras-chave insuficientes em títulos de página ou descrições de meta:

(?i)(título:|descrição:).*\bpalavra-chave\b

Essa expressão irá procurar por títulos ou descrições de meta que não contêm a palavra-chave especificada, independentemente da capitalização.

2 – Encontrar páginas com títulos ou descrições de meta muito longos:

(?i)(título:|descrição:).{70,}

Essa expressão irá procurar por títulos ou descrições de meta com mais de 70 caracteres, independentemente da capitalização.

3 – Verificar se há páginas com títulos ou descrições de meta muito curtos:

(?i)(título:|descrição:).{0,10}

Essa expressão irá procurar por títulos ou descrições de meta com menos de 10 caracteres, independentemente da capitalização.

4 – Encontrar páginas com URLs muito longas ou complexas:

^https?://.{100,}$

Essa expressão irá procurar por URLs com mais de 100 caracteres.

5 – Verificar se há páginas com URLs muito curtas ou simples:

^https?://.{0,5}$

Essa expressão irá procurar por URLs com menos de 5 caracteres.

6 – Encontrar páginas com muito pouco conteúdo relevante:

^(?:(?!palavra-chave).)*$

Essa expressão irá procurar por páginas que não possuem a palavra-chave especificada.

7 – Verificar se há páginas com conteúdo duplicado:

(?i)\b(?:conteúdo)\b.*\b\1\b

Essa expressão irá procurar por conteúdo que é repetido na mesma página, independentemente da capitalização.

8 – Encontrar páginas com títulos ou descrições de meta que não são relevantes para o conteúdo da página:

(?i)(título:|descrição:).*(palavra-chave-irrelevante|outra-palavra-chave-irrelevante)

Essa expressão irá procurar por títulos ou descrições de meta que contêm palavras-chave irrelevantes, independentemente da capitalização.

9 – Verificar se há páginas com conteúdo de baixa qualidade ou spam:

(?i)\b(viagra|cialis|poker|casino|adulto|pornô)\b

Com o conhecimento e uso adequado das expressões regulares, você poderá otimizar e aperfeiçoar seu site de maneira mais eficiente, garantindo resultados melhores nos mecanismos de busca e uma experiência de usuário mais agradável.

Saiba mais sobre SEO agora mesmo!

Artigo Relacionado:  7 maneiras de aumentar o tráfego do site em 2022 (passo a passo)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *