evita contenido duplicado

Evitar contenido duplicado: 6 estrategias para solucionarlo

SEO

|

2 de junio de 2016

Evitar contenido duplicado: 6 estrategias para solucionarlo

Artículo actualizado el 19 de junio de 2024

El contenido duplicado es un factor determinante en el SEO on page que a menudo pasa desapercibido.

Se puede producir a pesar de tener optimizado tu sitio web para los buscadores.

Este problema tan común afecta negativamente al posicionamiento SEO.

Al evitarlo y optimizarlo no solo vas a mejorar la visibilidad en los motores de búsqueda, sino que también garantiza una experiencia de usuario excelente en tu sitio web.

Por ello, consideramos que este tema es esencial cuando los usuarios se preguntan qué es SEO y cuáles son los factores que ayudan a posicionar un sitio web.

Quédate en este artículo y conoce todo sobre el contenido duplicado en un sitio web, cómo detectarlo y solucionarlo.

¿Qué es contenido duplicado?

El contenido duplicado es el contenido que se repite en más de una URL.

Pudiendo ser dicha URL interna, dentro de nuestro sitio web, o externa si es en otro website que ha podido copiar tu contenido.

Sin embargo, el término puede referirse a contenido casi idéntico.

Por ejemplo, si tienes una tienda online y tienes dos url con el mismo contenido pero solo cambia el color del producto.

De hecho, en este tipo de situaciones, aunque algunas palabras cambien entre ambas urls, no se considerará suficiente para que no se considere contenido duplicado.

En este sentido, el contenido duplicado genera diversos problemas:

  • En la página de resultados de Google aparece la «versión incorrecta» de una página o la página que no quieres que se muestre.
  • Las páginas sufren problemas de rastreo e indexación
  • Las métricas de tu sitio web descienden y por tanto, el ranking en la serp
  • Experiencia negativa del usuario y por tanto, contenido poco fiable (incumpliendo, según Google, criterios de calidad E-E-A-T )
Factores de posicionamiento EEAT – Evitar contenido duplicado

Contenido duplicado en otro sitio web

Si se trata de que el mismo contenido que tengo en mi sitio web está en una web externa que no es de mi propiedad, podemos decir que se trata de contenido duplicado externo.

En este caso podemos pensar en un spammer.

Es alguien que copia el contenido de tu sitio web y los pega literalmente en otra de manera intencionada.

O bien tratarse de scrapping.

Esto ocurre si se usan robots para el mismo fin (copian tus páginas y las pegan en otros dominios). Pero afortunadamente, esto ocurre cada vez con menos frecuencia.

Actualmente Google se encarga de penalizar este tipo de acciones donde no se piensa en ofrecer información útil y original al usuario, sino solo en escalar posiciones en la página de resultados.

También existen otras dos posibilidades respecto al contenido duplicado y que suele ser más frecuente de lo habitual.

¿Tienes varios dominios y ofreces el mismo producto o servicio en países distintos que comparten el mismo idioma?

Si la respuesta es afirmativa, ya sabes qué ocurre.

Otro caso puede ser el siguiente: ¿Compartes contenido, que previamente ya está en tu web, y ese mismo se publica en un sitio web amigo o en una red social?

Si tu respuesta es afirmativa y el contenido es literalmente exacto (y no se trata de un extracto), Google también puede considerar que es contenido duplicado.

Contenido duplicado interno. ¿Cómo puede ocurrir en mi propia web?

Efectivamente, puede ocurrir que en tu propia web Google considere que tengas contenido duplicado.

Y se puede deber a varios factores.

En el primer caso, el contenido duplicado se debe a que tu propio sitio está generando copias de una misma página bajo URL diferentes.

La mayoría de veces es algo no intencionado que puede estar siendo producido por tu propio gestor de contenidos (CMS) de manera no malintencionada.

Un ejemplo muy típico para ilustrar la definición, es que tu sitio web no tenga priorizado el dominio canonical sobre el no canonical:

  1. nombredominio.com
  2. www.nombredominio.com

Lo más probable es que no seas consciente de que eso está ocurriendo.

El problema es que con ambas url llegas a la misma página. Y sin ningún tipo de redireccionamiento de uno sobre el otro.

Tienes el mismo contenido y el buscador no sabe cuál de ambas es la correcta para enseñar en la página de resultados.

Por tanto, dejas en manos de Google la elección y a lo mejor su criterio no coincide con el que tú quieres mostrar.

En este caso te aconsejamos que decidas cuál de los dos será el dominio principal y lo especifiques en Google Search Console.

Unas vez decidido, a través de esta guía de Google debes trabajar la canonicalización de url de páginas duplicadas.

Evitar contenido duplicado – etiqueta canonical

O bien, te sugerimos como alternativa que crees un redireccionamiento de una sobre otra.

Para que la elegida sea la que se muestre al usuario el contenido que queremos que se indexe y se asocie al dominio en los buscadores.

Otra consecuencia de tener contenido duplicado en tu propia casa, se relaciona con la eficacia con la que la araña rastreará tu website.

Te aseguramos que el sitio será rastreado de manera mucho menos eficaz.

Gastará muchos recursos en explorar varias URLS con contenido duplicado. Y el tiempo dedicado al resto de tu contenido será menor.

Ejemplo de contenido duplicado interno

Para que te hagas idea de lo frecuente que es la duplicidad de contenido que puede estar ocurriendo en tu propia web.

Veamos un ejemplo:

Supongamos que tienes un e-commerce con gran cantidad de productos que pertenecen a varias categorías al mismo tiempo.

Vamos a suponer que el artículo en cuestión son unas sandalias de mujer de la firma AMDT.

Estas mismas sandalias el usuario las va a poder encontrar en las siguientes categorías:

  • Sandalias
  • Calzado mujer
  • Outlet
  • Otra categoría…

Este caso se trata de contenido duplicado.

¿Porqué? Se debe a que ofreces exactamente el mismo contenido con url distintas debido a las distintas categorías.

Y esto es tan solo un ejemplo concreto.

En los e-commerce, especialmente, nos podemos encontrar multitud de casos sobre contenido duplicado.

La paginación, escaso contenido, mismo producto con diferentes versiones y distintas url, son claros ejemplo de contenido duplicado.

evita contenido duplicado
Evita el contenido duplicado

Estrategias para evitar y solucionar el contenido duplicado

Hay otros muchos posibles escenarios donde se esté generando contenido duplicado sin saberlo.

Por ello aquí te contamos algunas estrategias para evitarlo y también para solucionarlo.

Taxonomía:

Es fundamental revisar la estructura de tu sitio web.

Independientemente de si tus páginas son nuevas o existentes, es importante rastrearlas, mapearlas y asegurarse de que cada una tenga un H1 único y una palabra clave específica.

Organizar tu contenido en clústeres temáticos no solo optimiza la navegación, sino que también te permite desarrollar una estrategia detallada que previene la duplicación de contenido.

Canonical:

Sin duda alguna, la regla de oro para indicar al buscador qué URL es la adecuada para mostrar, es el uso de la etiqueta “rel=canonical”.

Una etiqueta de código HTML que se ubica en el head de la página web.

Su misión es indicar al buscador qué página de entre todas las de contenido duplicado debe indexarse.

Esta etiqueta le dice a la araña: “¡Hey! yo soy la página buena, muéstrame en la serp a mí”. Y guía a los robots a dicha URL.

Es un aviso para las arañas escrito en su propio idioma. Con la “rel=canonical” las arañas solo tendrán ojos para la URL que tú decidas.

Contenido duplicado - estrategias para evitarlo
Contenido duplicado – estrategias para evitarlo

Metaetiquetas:
También puedes prohibir el paso a los robots a determinadas páginas de contenido duplicado usando el archivo robots.txt.

Así evitas la indexación de aquello que elijas de todo tu sitio web de manera más centralizada.

O bien puedes usar las etiquetas metarobots de cada página en particular.

Tú decides qué, cuándo y cómo.

Parámetros:

Los parámetros URL pueden causar duplicación de contenido al crear copias de una página.

Por ejemplo, varias versiones de un mismo producto pueden ser vistas como duplicadas por Google.

Organizar estos parámetros facilita un rastreo eficiente. Para sitios grandes o con funciones de búsqueda, es esencial usar Google Search Console.

Al especificar a Google las páginas parametrizadas, aseguras que no sean rastreadas y clarificas las medidas adicionales a tomar.

URL duplicada:

Este punto ya lo hemos mencionado anteriormente.

Las formas comunes de duplicación incluyen versiones HTTP y HTTPS, www y no-www, y páginas con o sin barras finales. Es crucial elegir una versión y mantenerla en todo el sitio para evitar duplicación.

Configura redirecciones para dirigir a la versión correcta, como mysite.com a www.mysite.com.

Además, las URL HTTP son menos seguras que las versiones HTTPS, que utilizan cifrado SSL.

Redirecciones

Y siempre nos quedaran los redireccionamientos.

Al emplear redireccionamientos para eliminar el contenido duplicado, recuerda dos aspectos clave:

  • Redirige siempre a la página con mejor rendimiento para minimizar el impacto en tus métricas
  • Redirección 301

Las redirecciones 301 «son bilingües».

Hablan el lenguaje humano y el de los robots y guían a ambos al mejor destino automáticamente: la URL que decidas para evitar contenido duplicado.

Por supuesto tienen más utilidades, pero hoy nos ceñimos a la duplicidad de contenido.

El contenido es el rey… y lo sabes.

En cualquier caso, el contenido duplicado es algo que no le gusta a Google.

No es su tipo, y ya sabes lo mucho que cuida al usuario ofreciéndole contenido que aporte experiencia, conocimiento, fiabilidad y autoridad.

El contenido duplicado va en contra de esta premisa.

Y del algoritmo diseñado específicamente para ello: Google Panda.

Este premia el contenido relevante y de calidad. El contenido duplicado no es precisamente algo que Panda vaya a reforzar.

Contenido duplicado - algoritmo Panda Google
Contenido duplicado – algoritmo Panda Google

Si tienes abundante contenido duplicado estás diciendo a los robots de Google que tu web no tiene calidad.

Sencillamente porque no tienes contenido relevante.

Vamos, que te repitas más que el ajo no es precisamente el estilo de Panda. Más bien lo que vas a provocar es una pérdida del posicionamiento.

Como te decíamos al comienzo del post, el contenido duplicado es un factor determinante en el posicionamiento SEO para los buscadores (¿o era anti-lívido para Pandas?).

En la mayoría de las búsquedas Google mima al usuario con variedad en cada bloque de resultados. Por tanto se esfuerza por priorizar resultados heterogéneos y no URL diferentes con contenido duplicado.

Si tienes sospechas de que tienes contenido duplicado en tu web, crees que estás penalizado por Google, te recomendamos solucionarlo.

En nuestra Consultora Marketing Online puedes contar con un equipo de profesionales dedicados a ofrecerte el mejor servicio posicionamiento SEO.

Comparte esta publicación

Te puede interesar...