Contenido duplicado, ¿Qué es y cómo lo evito?

¿Qué es el contenido duplicado?

El contenido duplicado en SEO es uno de los problemas más comunes, al que no se le presta la suficiente atención. Se da cuando la información de una página es similar o igual a otra (un mismo texto se repite en varias URLs) tanto internamente (dentro de tu propia web) como externamente (un tercero tiene el mismo contenido que tu web). Muchas veces no es intencionado, lo crea nuestro propio gestor de contenidos, pero otras veces sí lo es y se puede penalizar.

Situaciones en las que se considera contenido duplicado

Contenido dentro de tu página

  • Contenido similar en varias de las páginas, tanto parcial como totalmente. Mismo texto en dos o más URLs distintas o dos o más URLs que vayan a una misma página.
  • No indicar el dominio canónico y páginas seguras: las direcciones web también se consideran contenido duplicado, en el caso que se utilicen varias combinaciones de dominio en las webs y no dirijan el tráfico a la misma página. Por ejemplo, el uso del http, https, www. o sin www. la terminación del domino .com., .es… Si tu sitio opera con “www.” y sin “www.” y ahora con las páginas seguras, con “http” y con “https” y no estableces cual es la versión principal (la canónica), provocas que se considere que tu sitio está duplicado, ya que varios dominios dirigen a la misma web con el mismo contenido.
  • Cuando un 30% del texto ya está publicado en otras URLs.
  • Utilizar el mismo Title y Meta Descripción para varias página.
  • Imágenes y archivos: algo más normal en los blogs. Usar repetitivamente las mismas etiquetas y las mismas categorías en los posts de los blogs. Incluir un mismo artículo en diferentes categorías o usar mismas etiquetas en varios artículos provoca que el mismo contenido aparezca en diferentes páginas.
  • IDs de sesión o contenido dinámico: muchos sitios utilizan sesiones de usuario diferentes (metiendo un código al final de la URL) o controlan el contenido que le aparece a cada usuario asignando parámetros a las URLs, si esto no se marca correctamente puede que el buscador también lo considere como páginas distintas con mismo contenido, aunque sean la misma con diferentes parámetros.
  • Versión móvil: si tu versión móvil está en una URL diferente y no lo indicas correctamente, los buscadores también pueden considerarla como contenido duplicado.

Contenido en páginas externas

  • Cuando mandas tu contenido a otros sitios para atraer tráfico a tu web. Si publicas una copia exacta y completa (y no solo una parte) y no lo enlazas con la fuente original.
  • Si publicas el mismo contenido y te diriges a varios países, al poner el mismo contenido en diferentes dominios.
  • Scraping, técnica que usa programas de software para extraer información de un sitio web. Puede usarse para copiar una página y publicarla en otro dominio.
  • Si alguién plagia un texto de tu web (o al revés) y lo publica en otro dominio como si fuera suyo, sin nombrar la fuente original.

¿Afecta esto a mi web?

Esto no es motivo de penalización si no se da en un porcentaje alto, pero es recomendable evitar el contenido duplicado en la medida de lo posible. Google no penaliza el contenido duplicado siempre que no considere que el contenido haya sido duplicado con la finalidad de manipular las búsquedas. Aunque no implique penalización, Google sí lo rechaza y lo filtra para que no aparezca en sus resultados. Si tu sitio tiene contenido duplicado puedes estar perdiendo capacidad de aparecer en los resultados de búsqueda , bajando la posición de las páginas que tienen el contenido duplicado, debido a que los buscadores no puedan determinar las páginas más relevantes para una determinada búsqueda

Como en todo, si que hay sitios web que copian o rehacen contenido de otros de forma continua y estos sitios sí son penalizados. Matt Cutts, fue el director del departamento de Google contra el spam, anuncio que un 25% del contenido en Google es duplicado. El famoso algoritmo, Google Panda, se diseñó para esto y se dedica única y exclusivamente a detectar el contenido duplicado.

¿Cómo soluciono el problema del contenido duplicado?

Es recomendable que revises la información de tu sitio web de forma continua para asegurarte de no tener excesivo contenido duplicado. Utiliza Google Search Console con frecuencia para conocer la situación de tu web, desde aquí también puedes indicar a Google como prefieres que indexe tu sitio y la URL que prevalece (la canónica). Google ofrece consejos para paliar la duplicación de contenido. Algunas de las soluciones que te recomendamos son:

Crea un esquema de urls y contenidos acorde con lo que quieres mostrar

Los enlaces internos de tu contenido deben tener una URL acorde y coherente con el contenido y con tu web, no pongas una URL que traiga tráfico a una página concreta cuyo contenido no tenga nada que ver con lo que indica la URL. Utiliza un título y una meta descripción diferentes para cada página.

Unifica contenidos similares en la misma página, en lugar de separarlas en páginas diferentes. Evita la repetición de expresiones y textos en la medida de lo posible, puedes hacer uso de la opción “Leer más” para evitar la repetición del mismo contenido.

Comparte el texto de tu web con prudencia

Google muestra a los buscadores la versión de la información que más se adapta al contenido de la búsqueda realizada, puede que sea el texto de tu web o de una web en la que hayas compartido tu contenido. Para evitar que se considere que el contenido que muestra es el original y no una réplica del original que voluntariamente se ha compartido, es recomendable que en cada sitio donde hayas compartido tu contenido metas un enlace hacía el sitio donde originalmente se ha publicado. Si fuera posible, indica a las páginas que estén utilizando tu contenido que en su meta-etiqueta marquen la opción de “noindex”. En el caso de que ninguna de estas opciones funcionen, podremos pedirle a Google que desautorice los enlaces a través de la desautorización de enlaces.

Indica a los buscadores que has sido el primero

Si has creado un contenido original, de calidad y no quieres que otros te copien, envía a Google ese contenido al momento de publicarlo (puedes hacerlo con Search Console). Google considera original la primera página que indexa, pero puede que no sea la primera que se publicó. Por tanto asegúrate que la primera página indexada es la tuya y no una copia.

Utiliza las etiquetas “noindex” y “nofollow”

Marca en las páginas que no te interese que se rastreen la opción de noindex, nofollow para que no te indexen páginas concretas. Esto ayuda a que, aunque en la página web hables de temas distintos a los que quieres que se te posicione, Google no te relacionará con esas temáticas.

No publiques contenido vacío, si te interesa publicar páginas en blanco, por la razón que sea, utiliza la meta-etiqueta noindex.

Utiliza el elemento “Canonical”

No se recomienda bloquear a los rastreadores el acceso a cualquier contenido duplicado dentro de una misma web, porque en lugar de detectar que ambas páginas están redirigiendo al mismo contenido, detectará que son páginas únicas y sin ningún uso común, entonces es cuando realmente tu web estará perdiendo calidad. La solución en esta situación es la de indicarle al robot que el contenido es duplicado mediante el elemento de enlace (rel=”canonical” ). Indica cual de las urls duplicadas es la que debe ser principal.

Cuando uses diferentes dominios pero todos redirigen a la web principal, indica en Google Search Console cual es el subdomino principal (canónico) que quieres utilizar.

Redirige las páginas duplicadas (redirección 301)

Con esta acción le indicamos a Google que el contenido de una página también está en otra página, pero en la búsqueda no se muestran las dos páginas iguales. Se suele usar si no puedes usar la etiqueta canónica, cuando mueves el contenido de una página a otra o cuando estableces el dominio canónico.

Utiliza la etiqueta hreflang

Úsala para contenido duplicado en distintos países, con esta etiqueta se indica que versión aparece en cada país, indicando el idioma y el país. Para España sería así (hreflang=”es-es”)sobre todo se utiliza para páginas que son visibles en otro país pero que se han traducido.

Categorías y etiquetas

Para evitar los efectos del contenido duplicado en las categorías y en las etiquetas se recomienda usar pocas categorías y pocas etiquetas, en el caso que queramos seguir utilizándolas pero no tenemos muy claro como agruparlas podemos utilizar el noindex, follow a las páginas de etiquetas y categorías, se puede alternar esta opción según lo que nos interese indexar, en este enlace se explica como bloquear la indexación de búsquedas con metaetiquetas no index. Si consideras que las categorías de tus contenidos son importantes, una buena práctica es indexar las categorías pero no las etiquetas y meter el contenido en una única categoría.

Cómo detectar el contenido duplicado

  • Además de Google Search Console también existen otras páginas donde analizar los enlaces de tu sitio web,estas son algunas de las más utilizadas para analizar el contenido interno de tu web: Screamingfrog, Google Analytics, Siteliner, Semrush, Moz.
  • Pero si lo que quieres es descubrir si otros han duplicado o plagiado tu contenido algunas herramientas que puedes utilizar son: Copyscape, PlagiumPlagiarisma, Dupli Checker, Plagspotter, CopyGatorDupe Free Pro. También puedes utilizar los operadores de búsqueda avanzada de Google, buscando manualmente frases originales de tu contenido entre comillas.
  • Utilizando el comando site: seguido de tu dominio en el buscador de Google podrás ver todo lo que está indexado de tu web.

Estas herramientas te pueden ayudar a detectar contenido duplicado, pero no todas son 100% efectivas, más aún si utilizas su versión gratuita. Lo mejor es que pruebes varias y descubras cuál es la que mejor te funciona, si consideras que alguna merece la pena para usar de forma periódica, utiliza su versión de pago.

Tampoco debemos alarmarnos sobre lo que es contenido duplicado, si citas un fragmento de texto, amplías información de algún texto y aportas valor o  haces un resumen y citas a la fuente, no tiene porqué considerarse contenido duplicado. Es importante mantener un porcentaje alto de contenido único, propio y diferente y revisar tu web continuamente.

Hay casos extremos donde Google considera que un sitio web es un sitio engañoso y puede llegar a eliminarlo de sus buscadores. Si esto te sucede, una vez revisada la web y con los cambios pertinentes que debas hacer, puedes pedir a Google que haga una nueva revisión del contenido para incluirla en sus buscadores a través de una Solicitud de Reconsideración en la herramienta de Google Search Consoler.

Si necesitas ayuda no dudes en contactar con nosotros






Todos los datos personales recopilados en este formulario serán tratados por Diego Mestre Proyectos en Inernet S.L. como responsable de esta web. Los datos serán tratados para gestionar tu solicitud de información. Si además lo has aceptado, también podrán ser tratados para el envío de nuestras publicaciones, noticias, cursos, eventos, recursos exclusivos y resto de información relacionada con las actividades propias de la empresa. La base legal para el tratamiento de tus datos es el consentimiento del interesado. Podrás ejercer los derechos de acceso, rectificación, limitación y suprimir tus datos a través de info@comonline.es. Para información más detallada consulta nuestros Términos Legales.




¿Te ha gustado? Comparte
Facebooktwittergoogle_pluspinterestlinkedinmail

Síguenos en nuestras Redes Sociales
Facebooktwitterlinkedin
  • Etiquetas: , ,
  • ¡Cuéntanos!: