Google Search Console de una tienda de moda española mostraba 4.200 URLs indexadas. La tienda tenía 800 productos reales. El 81% de las URLs indexadas eran variantes generadas automáticamente: ?color=negro&talla=S, /camiseta-basica-azul/, /coleccion/?sort=precio-asc. Ninguna había sido creada intencionalmente. Todas consumían crawl budget. Ninguna posicionaba para nada.
El contenido duplicado en ecommerce no es un error de principiante. Es una consecuencia casi inevitable de cómo funcionan las plataformas modernas. Cada variante genera una URL, cada filtro activo genera otra, cada categoría paginada genera una tercera. Sin una estrategia técnica explícita, una tienda mediana puede tener tres o cuatro veces más URLs duplicadas que páginas de valor real. Este artículo te explica exactamente qué pasa, dónde buscar y cómo solucionarlo de forma que no tengas que volver a hacerlo dentro de seis meses.
Los cinco tipos de contenido duplicado que acechan tu tienda online
Antes de buscar soluciones, conviene saber exactamente qué tipos de duplicado existen. No todos tienen la misma gravedad ni la misma solución.
El duplicado por variantes de producto es el más común. Una camiseta disponible en cuatro colores y cinco tallas puede generar veinte URLs, todas con el mismo título, la misma descripción y el mismo precio, diferenciadas solo por un parámetro de URL como ?color=azul o por una ruta propia como /camiseta-basica-azul/. Si tu plataforma crea URLs separadas para cada combinación, estás multiplicando exponencialmente el número de páginas que Google tiene que rastrear —y que potencialmente indexará de forma fragmentada.
El duplicado por parámetros de URL aparece cuando los filtros de categoría, el ordenamiento o el seguimiento de campañas añaden parámetros a las URLs. Una misma página de categoría puede ser accesible como /camisetas/, /camisetas/?sort=precio-asc, /camisetas/?color=negro&sort=precio-asc y /camisetas/?utm_source=newsletter. Cuatro URLs, un solo contenido. Google rastreará las cuatro si no le dices que no lo haga.
Las descripciones de fabricante merecen una categoría propia porque representan duplicados externos, no internos. Según un análisis de Semrush publicado en 2023, las descripciones de producto copiadas del fabricante aparecen en un promedio de doce tiendas diferentes. Google no puede saber cuál es la original —aunque generalmente da preferencia al fabricante o a la tienda con más autoridad— y elige una para posicionar. La tuya puede no ser la elegida.
La paginación de categorías genera URLs tipo /categoria/page/2/, /categoria/page/3/ que comparten header, footer, barra de filtros y muchos productos con la página anterior. Google las trata como páginas distintas con contenido parcialmente solapado.
Las URLs con y sin trailing slash, con y sin www, con y sin mayúsculas son el tipo de duplicado más fácil de solucionar pero sorprendentemente frecuente. /producto/ y /producto son técnicamente URLs diferentes. Lo mismo ocurre con http:// y https://, o www.tienda.com y tienda.com. Un redirect 301 bien configurado a nivel de servidor resuelve este caso en minutos.
El problema real de las descripciones de fabricante
Hay una idea extendida de que copiar la descripción del fabricante es una solución aceptable para tiendas con miles de referencias. Es comprensible: escribir contenido original para 5.000 productos tiene un coste real. Pero las consecuencias técnicas son más severas de lo que se suele admitir.
Cuando Google rastrea tu página de producto y encuentra la misma descripción que ya tiene indexada en la web del fabricante y en otras ocho tiendas, tiene que tomar una decisión: ¿a qué URL envía el tráfico para ese contenido? El algoritmo aplica lo que Google llama “consolidación de URLs duplicadas”, y su elección depende de factores como la autoridad del dominio, la antigüedad de la URL, las señales de usuario y las canonical tags declaradas. Sin una canonical tag explícita, es una lotería.
Patrick Stox, experto en SEO técnico de Ahrefs, lo explicó de forma directa en una entrevista de 2023: “El contenido duplicado no penaliza por sí mismo, pero sí desperdicia presupuesto de rastreo y diluyó las señales de ranking. En ecommerce, donde las páginas de producto son el núcleo del negocio, este desperdicio puede ser la diferencia entre posicionar en la primera página o en la tercera.”
La solución pragmática no es reescribir todo el catálogo de golpe. Es priorizar. Las tiendas que escriben descripciones originales para su top 20% de productos —los que generan el 80% del tráfico y las ventas— ven un incremento medio del 18% en tráfico orgánico a esas páginas específicas. Para el resto del catálogo, la combinación de canonical tags bien configuradas y títulos únicos es suficiente para que Google tome la decisión correcta.
Cómo los parámetros de URL multiplican el problema
Los parámetros de URL son quizás el generador de duplicados más voraz en ecommerce. Cada funcionalidad que añades a tu tienda tiene el potencial de crear decenas de nuevas URLs: filtros de búsqueda facetada, ordenamientos, paginación, sesiones de usuario, parámetros de tracking de campañas, comparadores de productos, listas de deseos con token de compartir.
Toma el caso de una tienda de moda mediana con 200 páginas de categoría. Si cada categoría tiene cinco filtros con cuatro opciones cada uno y cuatro opciones de ordenamiento, el número teórico de combinaciones de URL se dispara a cifras astronómicas. En la práctica, Google rastreará cientos o miles de estas combinaciones si no hay señales claras de que no debe hacerlo.
Las herramientas de rastreo como Screaming Frog o Sitebulb muestran este problema con claridad. Un rastreo típico de una tienda sin gestión de parámetros descubre que el 40-60% de las URLs rastreadas son variaciones de parámetros de páginas que ya existen limpiamente.
La solución pasa por tres mecanismos complementarios:
Primero, Google eliminó la herramienta «Parámetros de URL» de Search Console en abril de 2022. Actualmente, Googlebot gestiona los parámetros de forma autónoma. La mejor práctica es implementar etiquetas canonical en las páginas parametrizadas apuntando a la URL limpia, bloquear combinaciones de filtros innecesarias mediante robots.txt, y mantener una estructura de URLs limpia que minimice los parámetros superfluos.
Segundo, para paginación (página 2, 3…), cada página debe usar canonical self-referencing —apuntando a sí misma— ya que cada página ofrece contenido único. Para filtros sin demanda de búsqueda (combinaciones que no tienen volumen de búsqueda), el canonical debe apuntar a la URL base de la categoría. Para filtros con demanda de búsqueda demostrada, evalúa si merecen ser páginas independientes con canonical propio.
Tercero, el diseño técnico de la navegación facetada puede evitar que las URLs de filtros sean rastreables en primer lugar. Si los filtros actualizan el contenido de la página mediante JavaScript sin cambiar la URL, o si las URLs filtradas tienen un noindex proactivo, el problema no llega a existir.
Variantes de producto: la estrategia correcta según tu plataforma
La gestión de variantes depende en buena medida de la plataforma que uses, pero el principio es el mismo en todos los casos: decide si cada variante merece su propia URL con valor SEO independiente, o si todas las variantes deben agruparse bajo una única URL de producto.
Shopify crea por defecto una URL por producto (no por variante), pero las variantes son accesibles mediante parámetros: /products/camiseta-basica?variant=123456789. El parámetro variant no suele crear problemas de indexación graves porque Google generalmente lo ignora. Sin embargo, si decides crear páginas de producto separadas para variantes (algo que algunas tiendas hacen para capturar tráfico de búsqueda específico, como “camiseta básica azul marino”), debes implementar canonical tags apuntando a la variante principal.
WooCommerce puede generar URLs separadas para cada variante si el producto tiene atributos configurados como páginas separadas. La solución habitual es asegurarse de que las variantes no tengan URL propia y que el producto base use un selector de variantes mediante JavaScript.
Magento es el más propenso a la proliferación de URLs porque su arquitectura permite gran flexibilidad en cómo se exponen las variantes. Un producto configurable puede generar URLs para cada combinación de atributo. La recomendación para Magento es consolidar variantes en una única URL de producto siempre que sea posible, y usar canonical tags en los casos donde las URLs separadas son necesarias por motivos de negocio.
La regla práctica: si el usuario buscando “camiseta básica azul talla M” merece llegar a una página específica porque hay diferencias de contenido relevantes (imágenes distintas, descripción adaptada, precio diferente), la URL separada tiene valor. Si el único cambio es el selector de color o talla, una sola URL con JavaScript es mejor.
Puedes profundizar en la gestión técnica de variantes y parámetros en nuestra guía de SEO técnico para tiendas online.
Canonical tags en ecommerce: implementación sin errores
La etiqueta canonical (<link rel="canonical" href="...">) es la herramienta principal para gestionar duplicados sin eliminar URLs que tienen valor funcional. Pero usarla mal puede ser peor que no usarla.
Los errores más comunes en implementaciones de canonical en ecommerce:
Canonical a sí misma en páginas de error. Si una página 404 o redirigida tiene una canonical self-referencing, estás diciéndole a Google que indexe una página que no existe o que redirige. Revisa que tus plantillas de error no hereden la canonical del sistema de forma automática.
Canonical inconsistente con hreflang. Si tienes la misma tienda en múltiples idiomas y las etiquetas hreflang apuntan a una URL mientras la canonical apunta a otra, Google tiene señales contradictorias. Aprende a gestionar esto en nuestra guía sobre SEO internacional para ecommerce.
Confundir /page/1/ con la URL base en canonicals paginadas. Si tienes /camisetas/page/1/ y /camisetas/, son dos URLs diferentes. La primera página debe redirigir o usar canonical hacia /camisetas/. El resto de páginas paginadas (/page/2/, /page/3/…) deben usar canonical self-referencing —apuntando a sí mismas—, ya que cada una ofrece productos distintos que merecen ser indexados.
Cadenas de canonicals. Si A apunta a B y B apunta a C, Google puede no seguir la cadena completa. Las canonicals deben apuntar directamente a la URL final.
La implementación correcta en la práctica: cada URL que no quieres que Google indexe como versión preferida debe declarar la URL que sí quieres como canonical. Eso incluye páginas con parámetros de filtro, variantes de producto, páginas paginadas y versiones con parámetros de tracking.
Paginación: el duplicado que nadie quiere atacar primero
La paginación es el duplicado con el que más tiendas conviven en paz durante años porque no parece urgente. Las categorías paginadas siguen funcionando, siguen siendo rastreadas, y el negocio no se cae. Pero hay un coste silencioso: el presupuesto de rastreo se gasta en páginas que no aportan tráfico, y las señales de autoridad se fragmentan entre veinte páginas de una misma categoría en lugar de concentrarse en una.
Google dejó de soportar rel=prev/next en marzo de 2019. Esto significó que la señal explícita que le decías al buscador “estas páginas son parte de una serie” desapareció. Desde entonces, la gestión de paginación correcta depende de:
Canonical tags self-referencing en cada página paginada (cada /categoria/page/N/ apunta a sí misma, no a la página 1). Esto evita que Google colapse todas las páginas en una sola y pierdas los productos indexados en páginas profundas.
Sitemap completo que incluya los productos de todas las páginas paginadas directamente. Si /categoria/page/5/ contiene productos que no aparecen en ningún otro lugar, inclúyelos en el sitemap directamente como URLs de producto, no como páginas paginadas.
Infinite scroll o “cargar más” como alternativa. Si tu tienda usa infinite scroll con JavaScript, asegúrate de que los productos cargados dinámicamente sean rastreables. La solución recomendada por Google es implementar URLs con fragmentos paginados (como ?page=2) que sirven el contenido sin JavaScript cuando Googlebot las accede directamente.
Herramientas de auditoría y proceso de diagnóstico
El diagnóstico de contenido duplicado requiere datos reales, no suposiciones. El proceso recomendado tiene tres fases.
Fase 1: Rastreo técnico
Usa Screaming Frog o Sitebulb para rastrear tu tienda completa. Configura el rastreo para que siga parámetros de URL y export el informe de URLs duplicadas (páginas con el mismo título, la misma descripción meta o el mismo contenido). El informe te dará una imagen de la magnitud del problema.
Fase 2: Validación en Google Search Console
En el informe de Cobertura, busca el número total de URLs indexadas. Compáralo con el número de URLs que realmente has diseñado para ser indexadas. Una diferencia grande (más del 50%) es señal de que hay duplicados siendo indexados. La herramienta de Inspección de URL te permite verificar qué versión de una URL específica tiene indexada Google y cuál es su canonical declarada vs. la canonical detectada.
Fase 3: Priorización por impacto
No todos los duplicados son iguales. Prioriza los que afectan a páginas de alto tráfico potencial (categorías principales, productos estrella) sobre los que afectan a variantes o productos de larga cola con poco volumen de búsqueda.
Herramientas complementarias: Ahrefs Site Audit detecta inconsistencias de canonical y páginas con contenido similar. SEMrush Site Audit tiene un módulo específico de contenido duplicado que analiza similitud textual. Siteliner es gratuito y cubre análisis básico de contenido duplicado interno.
El proceso completo de auditoría técnica se detalla en la guía principal de SEO técnico para ecommerce, donde también encontrarás checklists de implementación para cada una de estas herramientas.
Cuándo el noindex es la solución correcta
Hay situaciones donde ni la canonical tag ni reescribir el contenido es la opción óptima. El noindex —añadido como meta tag en el <head> o como cabecera HTTP— le dice a Google directamente “no incluyas esta URL en tu índice”.
Los candidatos claros para noindex en ecommerce:
Páginas de resultado de búsqueda interna (/search?q=camiseta). Son páginas dinámicas sin valor SEO propio que generan URLs infinitas.
Páginas de carrito, checkout, cuenta de usuario, confirmación de pedido. Ninguna de estas tiene valor de posicionamiento y exponer su existencia puede ser un problema de seguridad.
Páginas de variantes de producto sin diferenciación significativa de contenido cuando la alternativa (canonical) no es suficiente o hay razones técnicas para mantener las URLs separadas.
Páginas de resultados de filtros muy específicos que no corresponden a ningún volumen de búsqueda real (por ejemplo, /camisetas/?talla=XXL&color=beige&manga=corta).
La distinción importante: noindex y canonical no son equivalentes. Una canonical tag le dice a Google “prefiero esta URL”. Un noindex le dice “esta URL no debería estar en el índice”. Para variantes de producto, la canonical es generalmente más apropiada porque mantiene la URL rastreable y pasa señales. Para páginas funcionales sin valor SEO, el noindex es más directo.
El camino pragmático: priorizar sin paralizarse
Si has llegado hasta aquí y estás mirando tu tienda con algo parecido al vértigo, la perspectiva correcta es esta: no necesitas resolver todos los duplicados a la vez. El contenido duplicado en ecommerce es un problema de gestión continua, no un sprint de corrección única.
El orden de prioridad que funciona en la práctica:
-
Configura los redirects 301 para consolidar variantes de URL técnicas (www/no-www, http/https, trailing slash). Una tarde de trabajo, impacto inmediato.
-
Implementa canonical self-referencing en páginas con parámetros de filtro y páginas paginadas. Esto se puede automatizar en la plantilla de tu plataforma.
-
Trabaja las descripciones originales empezando por los 50-100 productos que más tráfico potencial tienen. Mide el impacto tres meses después y decide si ampliar.
-
Revisa Google Search Console mensualmente para detectar nuevas inflaciones de URLs indexadas que señalen problemas emergentes.
Como con muchos aspectos del SEO técnico, la mejora incremental consistente supera al sprint perfecto que nunca se ejecuta. La tienda que resuelve el 80% del problema en cuatro semanas tiene ventaja sobre la que lleva seis meses planificando la solución perfecta.
El contenido duplicado no se resuelve una vez. Se gestiona de forma continua. Cada actualización de plataforma, cada nueva categoría, cada nueva lógica de filtros puede reintroducir el problema. La diferencia entre tiendas que lo controlan y las que no no es el conocimiento técnico: es el hábito de mirar Google Search Console cada mes y reaccionar antes de que el problema escale.