contenido duplicado

Evitar contenido duplicado: un factor determinante del SEO

SEO

|

2 de junio de 2016

Evitar contenido duplicado: un factor determinante del SEO

El contenido duplicado es un factor determinante en posicionamiento SEO que a menudo pasa desapercibido y que se produce a pesar de tener optimizado tu website para los buscadores.

Hoy te traemos una definición y un poco de información al respecto. Así podrás comprobar si está pasando en tu web. También algunas maneras de evitarlo para sumar puntos en tu intento por seducir a Google.

Contenido duplicado es el contenido que se repite en más de una URL. Pudiendo ser dicha URL interna, si hablamos dentro de tu propio website, o externa si la repetición ocurre en otros websites.

En el primer caso, el contenido duplicado se debe a que tu propio sitio está generando copias de una misma página bajo URL diferentes. La mayoría de veces es algo no intencionado que puede estar siendo producido por tu propio gestor de contenidos (CMS) de manera no malintencionada.

Contenido duplicado interno: pero, ¿cómo es posible que ocurra en mi propio website?

Un ejemplo muy típico para ilustrar la definición, es que tu website no tenga priorizado el dominio canonical sobre el no canonical:

  1. nombredominio.com
  2. www.nombredominio.com

Lo más probable es que no seas consciente de que eso está ocurriendo. El problema es que con ambos dominios llegas a la misma página. Y sin ningún tipo de redireccionamiento de uno sobre el otro. Tienes el mismo contenido y el buscador no sabe cuál de ambas es la correcta para enseñar al mundo.  Por tanto, dejas en manos de Google la elección y a lo mejor su criterio no coincide con el que tú quieres mostrar.

En este caso te aconsejamos que decidas cuál de los dos será el dominio principal y se lo cuentes a Search Console. Aquí te dejamos unas notas de ayuda de las Herramientas de Google para el Webmaster. O bien, te sugerimos como alternativa que crees un redireccionamiento de una sobre otra. Para que la elegida sea la que se muestre al usuario el contenido que queremos que se indexe y se asocie al dominio en los buscadores.

Otra consecuencia de tener contenido duplicado en tu propia casa, se relaciona con la eficacia con la que la araña rastreará tu website. Te aseguramos que el sitio será rastreado de manera mucho menos eficaz. Gastará muchos recursos en explorar varias URLS con contenido duplicado. Y el tiempo dedicado al resto de tu contenido será menor.

Para que te hagas idea de lo frecuente que es la duplicidad ocurriendo bajo tu propio techo sin saberlo, te nombramos un par de escenarios que causan contenido duplicado. Pueden servirte de ejemplo, por nombrar solo algunos:

Tienes varias versiones de tu web porque no tienes un diseño de web responsive. Es decir, adaptado a todos los dispositivos: ordenador, móvil, tablet, etc. A estas alturas todavía ocurre más de lo que crees y mucha gente tiene dos URL diferentes para cada página. Una URL para la versión móvil y otra URL para la versión ordenador.

O tal vez tengas un e-commerce con gran cantidad de productos que pertenecen a varias categorías al mismo tiempo; el mismo zapato lo encuentras en la categoría sandalias, también en la categoría mujer y al mismo tiempo puede ser una oferta del mes: de nuevo se trata de contenido duplicado puesto que ofreces el mismo contenido con URL distintas. Este es solo otro ejemplo, porque los e-commerce son carne de cañón para el contenido duplicado: paginación, escaso contenido, el mismo producto con versiones diferentes…

Hay otros muchos posibles escenarios donde se esté generando contenido duplicado sin saberlo, por ello aquí te contamos algunas sugerencias que está bien que conozcas para que tu web no genere contenido duplicado y tengas bajo control las URL sea cual sea tu situación.

Mantener a raya el contenido duplicado: elementos que puedes implementar.

Sin duda alguna, la regla de oro para indicar al buscador qué URL es la adecuada para mostrar, es el uso de la etiqueta “rel=canonical”. Una etiqueta de código HTML que se ubica en el head de la página web. Su misión es indicar al buscador qué página de entre todas las de contenido duplicado debe indexarse. Esta etiqueta le dice a la araña: “¡Hey! yo soy la página buena, elígeme a mí”. Y guía a los robots a dicha URL. Es un aviso para las arañas escrito en su propio idioma. Con la rel canonical las arañas solo tendrán ojos para la URL que tú decidas.

También puedes prohibir el paso a los robots a determinadas páginas de contenido duplicado usando el archivo robots.txt. Así evitas la indexación de aquello que elijas de todo tu sitio web de manera más centralizada. O bien puedes usar las etiquetas metarobots de cada página en particular. Manejando ambas opciones, customizas a medida el comportamiento de las arañas por tu sitio web. Sin duda mantienes a raya el contenido duplicado. Tú decides qué, cuándo y cómo.

Y siempre nos quedaran los redireccionamientos 301; que son bilingües, hablan el lenguaje humano y el de los robots y guían a ambos al mejor destino automáticamente: la URL que decidas para evitar contenido duplicado. Por supuesto tienen más utilidades, pero hoy nos ceñimos a la duplicidad de contenido.

Y si el contenido duplicado está fuera, ¿por qué está ocurriendo?

Si se trata de contenido duplicado externo, podemos pensar en un spammer . Eso es alguien que copia tus textos y los pega literalmente en otra web de manera intencionada .  O bien tratarse de scraping. Eso ocurre si se usan robots para el mismo fin (copian tus páginas y las pegan en otros dominios). Pero afortunadamente esto ocurre cada vez con menos frecuencia. Google Panda se encarga de castigar este tipo de acciones donde no se piensa en ofrecer información útil y original al usuario sino solo en escalar posiciones en los bloques de resultados.

En el caso del contenido duplicado externo, suele ser más frecuente que estés repitiendo contenido en dominios diferentes porque ofreces, por ejemplo, el mismo producto o servicio en países distintos que comparten el mismo idioma.

O quizá estés compartiendo contenido con otro sitio web, como puede ser una red social o un blog amigo para darte a conocer, y estás enviando contenido duplicado puesto que literalmente se trata del mismo texto, y no de un extracto, por ejemplo.

El contenido es el rey… y lo sabes.

En cualquier caso, el contenido duplicado es algo que no le gusta a Google. No es su tipo, y ya sabes lo mucho que cuida al usuario ofreciéndole contenido útil y de calidad. El contenido duplicado va en contra de esta premisa. Y del algoritmo diseñado específicamente para ello: Google Panda. Este premia el contenido relevante y de calidad. El contenido duplicado no es precisamente algo que Panda vaya a reforzar.

contenido duplicado
contenido duplicado

Si tienes abundante contenido duplicado estás diciendo a los robots de Google que tu web no tiene calidad. Sencillamente porque no tienes contenido relevante. Vamos, que te repitas más que el ajo no es precisamente el estilo de Panda. Más bien lo que vas a provocar es una pérdida del posicionamiento. Esto es porque que las arañas del buscador no van a saber qué páginas de tu website son las más relevantes para una búsqueda determinada. Así que Google filtrará las duplicidades con su algoritmo.

Como te decíamos al comienzo del post, el contenido duplicado es un factor determinante en el posicionamiento SEO para los buscadores (¿o era anti-lívido para Pandas?). Merece la pena revisarlo y “hacer consciente” en el caso de que desconozcas si se está produciendo. Al fin y al cabo, se trata de aplicar el sentido común. En la mayoría de las búsquedas Google mima al usuario con variedad en cada bloque de resultados. Por tanto se esfuerza por priorizar resultados heterogéneos y no URL diferentes con contenido duplicado.

Si tienes sospechas de que tienes contenido duplicado en tu web, crees que estás penalizado por Panda y quieres solucionarlo, contacta con Aún Más Difícil Todavía y te ayudaremos a solucionarlo.

Comparte esta publicación

Te puede interesar...