Obtenha uma lista completa de 28 usos de expressões regulares REGEX para otimizar seu site e melhorar o SEO.
Aprenda a criar expressões regulares para identificar e corrigir erros, otimizar o conteúdo e realizar análises detalhadas em seu site.
Aproveite essas dicas valiosas para melhorar o desempenho de seu site e alcançar melhores resultados nos mecanismos de busca.
- O que é uma expressão regular regex?
- 1 – Verificar se há erros de digitação em suas páginas:
- 2 – Encontrar páginas com títulos duplicados:
- 3 – Verificar se há palavras-chave em títulos de página ou descrições de meta:
- 4 – Encontrar páginas com URLs longas ou complexas:
- 5 – Verificar se há erros de formatação em suas páginas:
- 6 – Encontrar páginas com muito pouco conteúdo:
- 7 – Verificar se há links quebrados em suas páginas:
- 8 – Encontrar páginas que não estão sendo indexadas pelo Google:
- 9 – Verificar se há problemas de redirecionamento em suas páginas:
- 10 – Encontrar páginas com muitos erros de ortografia ou gramática:
- 11 – Verificar se há links externos quebrados em suas páginas:
- 12 – Encontrar páginas com muitos erros de sintaxe em códigos HTML ou JavaScript:
- 13 – Verificar se há páginas com muitas imagens grandes ou pesadas:
- 14 – Encontrar páginas com muitos erros de formatação em tabelas:
- 15 – Encontrar páginas com muitos erros de ortografia ou gramática em inglês:
- 16 – Verificar se há páginas com muitos erros de sintaxe em arquivos XML:
- 17 – Encontrar páginas com muitos erros de formatação em listas:
- 18 – Verificar se há páginas com muitos erros de sintaxe em arquivos JSON:
- 19 – Encontrar páginas com muitos erros de formatação em parágrafos:
- 10 usos de REGEX relacionados ao SEO:
- 1 – Verificar se há palavras-chave insuficientes em títulos de página ou descrições de meta:
- 2 – Encontrar páginas com títulos ou descrições de meta muito longos:
- 3 – Verificar se há páginas com títulos ou descrições de meta muito curtos:
- 4 – Encontrar páginas com URLs muito longas ou complexas:
- 5 – Verificar se há páginas com URLs muito curtas ou simples:
- 6 – Encontrar páginas com muito pouco conteúdo relevante:
- 7 – Verificar se há páginas com conteúdo duplicado:
- 8 – Encontrar páginas com títulos ou descrições de meta que não são relevantes para o conteúdo da página:
- 9 – Verificar se há páginas com conteúdo de baixa qualidade ou spam:
O que é uma expressão regular regex?
Uma expressão regular, também conhecida como regex, é um padrão de caracteres utilizado para corresponder a uma sequência de caracteres em uma busca.
Elas são frequentemente usadas em aplicações de busca e edição de texto para localizar e substituir padrões específicos de caracteres.
As expressões regulares são construídas a partir de uma combinação de caracteres literais e metacaracteres, que são símbolos especiais que têm um significado especial quando usados em uma expressão regular.
Por exemplo, o metacaractere “.” corresponde a qualquer caractere único, enquanto o metacaractere “*” corresponde a qualquer quantidade de caracteres (inclusive zero).
As expressões regulares são amplamente utilizadas em muitas linguagens de programação e ferramentas, como o Google Search Console, para realizar buscas e manipulações de texto de maneira precisa e eficiente.
Veja agora uma lista com 20 expressões regulares Regex para usar no seu dia-a-dia como SEO!
1 – Verificar se há erros de digitação em suas páginas:
[^a-zA-Z0-9]
Essa expressão irá procurar por qualquer caractere que não seja uma letra ou número. Você pode ajustar isso para incluir outros caracteres se desejar.
2 – Encontrar páginas com títulos duplicados:
(?i)título:\s(.)\s+título:\s*\1
Essa expressão irá procurar por títulos que são iguais, independentemente da capitalização.
3 – Verificar se há palavras-chave em títulos de página ou descrições de meta:
(?i)(título:|descrição:).*\bpalavra-chave\b
Essa expressão irá procurar por palavras-chave em títulos ou descrições de meta, independentemente da capitalização.
4 – Encontrar páginas com URLs longas ou complexas:
^https?://.{50,}$
Essa expressão irá procurar por URLs que tenham 50 ou mais caracteres.
5 – Verificar se há erros de formatação em suas páginas:
<(?!(?:/?[a-zA-Z]|br)).*?>
Essa expressão irá procurar por tags HTML que não são fechadas corretamente.
6 – Encontrar páginas com muito pouco conteúdo:
^(?:(?!palavra-chave).)*$
Essa expressão irá procurar por páginas que não possuem a palavra-chave especificada.
7 – Verificar se há links quebrados em suas páginas:
]+href\s=\s["']?\s((?:(?!["']?\s>)[^'">])+)
Essa expressão irá procurar por links com URLs quebradas ou inválidas.
8 – Encontrar páginas que não estão sendo indexadas pelo Google:
meta name=["']?robots["']? content=["']?noindex["']?
Essa expressão irá procurar por páginas que tenham a tag “noindex” na meta tag “robots”.
9 – Verificar se há problemas de redirecionamento em suas páginas:
(?:http|https):\/\/(?:www.)?example.com(?:\/[a-zA-Z0-9\/]*)?
Essa expressão irá procurar por URLs de redirecionamento que apontem para o seu site. Você deve substituir “example.com” pelo seu próprio domínio.
10 – Encontrar páginas com muitos erros de ortografia ou gramática:
\b(?:seu|sua|suas|seus|sui|sou|era|foi|sao|são|éramos|éramos|fomos|somos|erais|eram|era|eras|eramos|erão|fui|foste|foi|fomos|foram|fores|for|formos|forem|seja|sejas|seja|sejamos|sejam|fosse|fosses|fosse|fôssemos|fossem|for|fores|formos|forem|sendo|sendo)\b
Essa expressão irá procurar por palavras comuns que são frequentemente confundidas ou escritas incorretamente em português.
11 – Verificar se há links externos quebrados em suas páginas:
]+href\s=\s["']?\s((?:(?!["']?\s>)[^'">])+)(?:[^>]+)?>((?:(?!<\/a>)[\s\S])*)?<\/a>
Essa expressão irá procurar por links externos quebrados em suas páginas.
12 – Encontrar páginas com muitos erros de sintaxe em códigos HTML ou JavaScript:
(?<=]>)[\s\S]?(?=<\/script>)
Essa expressão irá procurar por códigos HTML ou JavaScript com erros de sintaxe.
13 – Verificar se há páginas com muitas imagens grandes ou pesadas:
]+src\s=\s["']?\s((?:(?!["']?\s>)[^'">])+)(?:[^>]+)?>
Essa expressão irá procurar por imagens com tamanhos maiores do que um determinado limite.
14 – Encontrar páginas com muitos erros de formatação em tabelas:
(<table[^>]*>[\s\S]*?<\/table>)
Essa expressão irá procurar por erros de sintaxe em arquivos CSS.
15 – Encontrar páginas com muitos erros de ortografia ou gramática em inglês:
\b(?:your|you're|their|they're|there|we're|who's|whose|its|it's|isn't|aren't|wasn't|weren't|haven't|hasn't|hadn't|won't|wouldn't|don't|doesn't|didn't|shouldn't|can't|couldn't)\b
Essa expressão irá procurar por palavras comuns que são frequentemente confundidas ou escritas incorretamente em inglês.
16 – Verificar se há páginas com muitos erros de sintaxe em arquivos XML:
(?<=<\?xml[^>]>)[\s\S]?(?=<\/\?xml>)
Essa expressão irá procurar por erros de sintaxe em arquivos XML.
17 – Encontrar páginas com muitos erros de formatação em listas:
(<(?:ul|ol)[^>]>[\s\S]?<\/(?:ul|ol)>)
Essa expressão irá procurar por listas com erros de formatação, como itens que não estão fechados corretamente ou que não estão alinhados corretamente.
18 – Verificar se há páginas com muitos erros de sintaxe em arquivos JSON:
(?<=\{)[\s\S]*?(?=\})
Essa expressão irá procurar por erros de sintaxe em arquivos JSON.
19 – Encontrar páginas com muitos erros de formatação em parágrafos:
Essa expressão irá procurar por parágrafos com erros de formatação, como tags que não estão fechadas corretamente ou que não estão alinhados corretamente.
10 usos de REGEX relacionados ao SEO:
1 – Verificar se há palavras-chave insuficientes em títulos de página ou descrições de meta:
(?i)(título:|descrição:).*\bpalavra-chave\b
Essa expressão irá procurar por títulos ou descrições de meta que não contêm a palavra-chave especificada, independentemente da capitalização.
2 – Encontrar páginas com títulos ou descrições de meta muito longos:
(?i)(título:|descrição:).{70,}
Essa expressão irá procurar por títulos ou descrições de meta com mais de 70 caracteres, independentemente da capitalização.
3 – Verificar se há páginas com títulos ou descrições de meta muito curtos:
(?i)(título:|descrição:).{0,10}
Essa expressão irá procurar por títulos ou descrições de meta com menos de 10 caracteres, independentemente da capitalização.
4 – Encontrar páginas com URLs muito longas ou complexas:
^https?://.{100,}$
Essa expressão irá procurar por URLs com mais de 100 caracteres.
5 – Verificar se há páginas com URLs muito curtas ou simples:
^https?://.{0,5}$
Essa expressão irá procurar por URLs com menos de 5 caracteres.
6 – Encontrar páginas com muito pouco conteúdo relevante:
^(?:(?!palavra-chave).)*$
Essa expressão irá procurar por páginas que não possuem a palavra-chave especificada.
7 – Verificar se há páginas com conteúdo duplicado:
(?i)\b(?:conteúdo)\b.*\b\1\b
Essa expressão irá procurar por conteúdo que é repetido na mesma página, independentemente da capitalização.
8 – Encontrar páginas com títulos ou descrições de meta que não são relevantes para o conteúdo da página:
(?i)(título:|descrição:).*(palavra-chave-irrelevante|outra-palavra-chave-irrelevante)
Essa expressão irá procurar por títulos ou descrições de meta que contêm palavras-chave irrelevantes, independentemente da capitalização.
9 – Verificar se há páginas com conteúdo de baixa qualidade ou spam:
(?i)\b(viagra|cialis|poker|casino|adulto|pornô)\b
Com o conhecimento e uso adequado das expressões regulares, você poderá otimizar e aperfeiçoar seu site de maneira mais eficiente, garantindo resultados melhores nos mecanismos de busca e uma experiência de usuário mais agradável.
Saiba mais sobre SEO agora mesmo!
Consultor SEO e especialista em Otimização de Sites com foco em aumentar o tráfego orgânico. Professor e Especialista de SEO a mais de 20 anos com vasta experiência em SEO para pequenas, médias e grandes empresas.