Contenido duplicado en tu blog: Google’s Supplemental Index

En los blogs que corren bajo WordPress, una misma entrada individual es vista como contenido repetido cuando la visionamos bajo categorías, página de portada, páginas cronológicas o páginas de tags. Esto, a ojos de Google, es contenido duplicado, o mejor dicho, repetido varias veces a lo largo del blog en diferentes páginas.

Antes corría el rumor que este contenido repetido era perjudicial para la indexación de Google, ya que te podría ocasionar un baneo o penalización, pero parece que nuevas revelaciones por parte del propio Google, y por ejemplo, mi propia experiencia, no indican que haya perjuicio alguno por esta característica de WordPress.

google-supplemental-index

Según Google, de las páginas con contenido repetido, se escoge una de ellas para ser indexada y tenida en cuenta, mientras las demás pasan a un índice suplementario (Google’s Supplemental Index).

Podemos no obstante, evitar tener este contenido repetido de muchas formas. Por ejemplo, teniendo en nuestra plantilla de WordPress extractos de las entradas en vez de posts completos en las páginas cronológicas, de categoría, portada o tags.

Otro método es evitarlo usando un robots.txt adecuado en la raíz de nuestra instalación de WordPress, que obvie la indexación por parte de Google de esas páginas donde aparece el mismo texto. Algo así bastará.

User-agent: *
Allow: /feed/$
Disallow: /feed
Disallow: /comments/feed
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /comments
Disallow: /category/*/*
Disallow: /tag/*
Disallow: /page/*
Disallow: */trackback
Disallow: */comments
Disallow: /*?*
Disallow: /*?
Disallow: /search
Allow: /wp-content/uploads

# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /*

# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /*

# Internet Archiver Wayback Machine
User-agent: ia_archiver
Disallow: /

# digg mirror
User-agent: duggmirror
Disallow: /

Sitemap: http://www.elnombredetudominio.com/sitemap.xml

Otra forma de realizar un procedimiento similar, es hacerlo por la plantilla de tu blog, copiando esta condición de atributos en la parte de la cabecera de tu plantilla (header.php), entre las etiquetas <head> y </head>:

if((is_home() && ($paged < 2 )) || is_single() || is_page() || is_category()){
echo ‘<meta name=»robots» content=»index,follow» />’;} else {
echo ‘<meta name=»robots» content=»noindex,follow» />’;}

Para calcular el porcentaje de páginas indexadas por Google normales y las de índice suplementario, tienes una cómoda calculadora aquí.

Comparte este artículo

Deja un comentario

cuatro × 4 =