Portes sis mesos optimitzant la teva botiga. Has revisat els títols, millorat la velocitat de càrrega, aconseguit alguns enllaços. I llavors arriba l’informe de trànsit orgànic de març: caiguda del 22% respecte a l’any anterior. Obres Google Search Console i veus centenars d’URLs indexades que no reconèixes. Hi ha pàgines de producte amb paràmetres com ?color=vermell&talla=M, pàgines de col·lecció duplicades per cada combinació de filtre actiu, i la descripció del teu producte estrella —la mateixa que apareix al web del fabricant i en altres dotze botigues. El contingut duplicat en ecommerce és silenciós, sistemàtic i responsable que Google indexi versions del teu lloc que tu mai vas demanar que existissin.
El contingut duplicat no és un error de principiant. És una conseqüència gairebé inevitable de com funcionen les plataformes d’ecommerce modernes. Cada variant genera una URL, cada filtre actiu en genera una altra, cada categoria paginada en genera una tercera. Sense una estratègia tècnica explícita, una botiga mitjana pot tenir tres o quatre vegades més URLs duplicades que pàgines reals de valor. Aquest article t’explica exactament què passa, on buscar i com solucionar-ho de manera que no hagis de tornar-hi d’aquí a sis mesos.
Els cinc tipus de contingut duplicat que amenacen la teva botiga
Abans de buscar solucions, convé saber exactament quins tipus de duplicat existeixen. No tots tenen la mateixa gravetat ni la mateixa solució.
El duplicat per variants de producte és el més comú. Una samarreta disponible en quatre colors i cinc talles pot generar vint URLs, totes amb el mateix títol, la mateixa descripció i el mateix preu, diferenciades només per un paràmetre d’URL com ?color=blau o per una ruta pròpia com /samarreta-basica-blava/. Si la teva plataforma crea URLs separades per a cada combinació, estàs multiplicant exponencialment el nombre de pàgines que Google ha de rastrejar —i que potencialment indexarà de forma fragmentada.
El duplicat per paràmetres d’URL apareix quan els filtres de categoria, l’ordenament o el seguiment de campanyes afegeixen paràmetres a les URLs. Una mateixa pàgina de categoria pot ser accessible com /samarretes/, /samarretes/?sort=preu-asc, /samarretes/?color=negre&sort=preu-asc i /samarretes/?utm_source=newsletter. Quatre URLs, un sol contingut. Google rastrejarà les quatre si no li dius que no ho faci.
Les descripcions de fabricant mereixen una categoria pròpia perquè representen duplicats externs, no interns. Segons una anàlisi de Semrush publicada el 2023, les descripcions de producte copiades del fabricant apareixen en una mitjana de dotze botigues diferents. Google no pot saber quina és l’original —tot i que generalment dóna preferència al fabricant o a la botiga amb més autoritat— i tria una per posicionar. La teva pot no ser l’escollida.
La paginació de categories genera URLs tipus /categoria/page/2/, /categoria/page/3/ que comparteixen capçalera, peu de pàgina, barra de filtres i molts productes amb la pàgina anterior. Google les tracta com a pàgines distintes amb contingut parcialment solapant.
Les URLs amb i sense trailing slash, amb i sense www, amb i sense majúscules són el tipus de duplicat més fàcil de solucionar però sorprenentment freqüent. /producte/ i /producte són tècnicament URLs diferents. El mateix passa amb http:// i https://, o www.botiga.com i botiga.com. Un redirect 301 ben configurat a nivell de servidor resol aquest cas en minuts.
El problema real de les descripcions de fabricant
Hi ha una idea estesa que copiar la descripció del fabricant és una solució acceptable per a botigues amb milers de referències. És comprensible: escriure contingut original per a 5.000 productes té un cost real. Però les conseqüències tècniques són més severes del que s’admet habitualment.
Quan Google rastreia la teva pàgina de producte i troba la mateixa descripció que ja té indexada al web del fabricant i en altres vuit botigues, ha de prendre una decisió: a quina URL envia el trànsit per a aquell contingut? L’algorisme aplica el que Google anomena “consolidació d’URLs duplicades”, i la seva elecció depèn de factors com l’autoritat del domini, l’antiguitat de la URL, els senyals d’usuari i les canonical tags declarades. Sense una canonical tag explícita, és una loteria.
Patrick Stox, expert en SEO tècnic d’Ahrefs, ho va explicar de forma directa en una entrevista del 2023: “El contingut duplicat no penalitza per si mateix, però sí malgasta pressupost de rastreig i dilueix els senyals de ranking. En ecommerce, on les pàgines de producte són el nucli del negoci, aquest malbaratament pot ser la diferència entre posicionar a la primera pàgina o a la tercera.”
La solució pragmàtica no és reescriure tot el catàleg de cop. És prioritzar. Les botigues que escriuen descripcions originals per al seu top 20% de productes —els que generen el 80% del trànsit i les vendes— veuen un increment mitjà del 18% en trànsit orgànic a aquelles pàgines específiques. Per a la resta del catàleg, la combinació de canonical tags ben configurades i títols únics és suficient perquè Google prengui la decisió correcta.
Com els paràmetres d’URL multipliquen el problema
Els paràmetres d’URL són potser el generador de duplicats més voraç en ecommerce. Cada funcionalitat que afegeixes a la teva botiga té el potencial de crear desenes de noves URLs: filtres de cerca facetada, ordenaments, paginació, sessions d’usuari, paràmetres de seguiment de campanyes, comparadors de productes, llistes de desitjos amb token de compartir.
Pren el cas d’una botiga de moda mitjana amb 200 pàgines de categoria. Si cada categoria té cinc filtres amb quatre opcions cadascun i quatre opcions d’ordenament, el nombre teòric de combinacions d’URL s’eleva a xifres astronòmiques. A la pràctica, Google rastrejarà centenars o milers d’aquestes combinacions si no hi ha senyals clars que no ho ha de fer.
Les eines de rastreig com Screaming Frog o Sitebulb mostren aquest problema amb claredat. Un rastreig típic d’una botiga sense gestió de paràmetres descobreix que el 40-60% de les URLs rastrejades són variacions de paràmetres de pàgines que ja existeixen netament.
La solució passa per tres mecanismes complementaris:
Primer, Google va eliminar l’eina «Paràmetres d’URL» de Search Console l’abril de 2022. Actualment, Googlebot gestiona els paràmetres de forma autònoma. La millor pràctica és implementar etiquetes canonical a les pàgines parametritzades apuntant a la URL neta, bloquejar combinacions de filtres innecessàries mitjançant robots.txt, i mantenir una estructura d’URLs neta que minimitzi els paràmetres superflus.
Segon, per a paginació (pàgina 2, 3…), cada pàgina ha d’usar canonical self-referencing —apuntant a si mateixa— ja que cada pàgina ofereix contingut únic. Per a filtres sense demanda de cerca (combinacions sense volum de cerca), el canonical ha d’apuntar a la URL base de la categoria. Per a filtres amb demanda de cerca demostrada, avalua si mereixen ser pàgines independents amb canonical propi.
Tercer, el disseny tècnic de la navegació facetada pot evitar que les URLs de filtres siguin rastrejables en primer lloc. Si els filtres actualitzen el contingut de la pàgina mitjançant JavaScript sense canviar la URL, o si les URLs filtrades tenen un noindex proactiu, el problema no arriba a existir.
Variants de producte: l’estratègia correcta segons la teva plataforma
La gestió de variants depèn en bona mesura de la plataforma que usis, però el principi és el mateix en tots els casos: decideix si cada variant mereix la seva pròpia URL amb valor SEO independent, o si totes les variants han d’agrupar-se sota una única URL de producte.
Shopify crea per defecte una URL per producte (no per variant), però les variants són accessibles mitjançant paràmetres: /products/samarreta-basica?variant=123456789. El paràmetre variant no sol crear problemes d’indexació greus perquè Google generalment l’ignora. No obstant, si decideixes crear pàgines de producte separades per a variants, has d’implementar canonical tags apuntant a la variant principal.
WooCommerce pot generar URLs separades per a cada variant si el producte té atributs configurats com a pàgines separades. La solució habitual és assegurar-se que les variants no tinguin URL pròpia i que el producte base usi un selector de variants mitjançant JavaScript.
Magento és el més propens a la proliferació d’URLs perquè la seva arquitectura permet gran flexibilitat en com s’exposen les variants. La recomanació per a Magento és consolidar variants en una única URL de producte sempre que sigui possible, i usar canonical tags en els casos on les URLs separades són necessàries per motius de negoci.
La regla pràctica: si l’usuari cercant “samarreta bàsica blava talla M” mereix arribar a una pàgina específica perquè hi ha diferències de contingut rellevants (imatges distintes, descripció adaptada, preu diferent), la URL separada té valor. Si l’únic canvi és el selector de color o talla, una sola URL amb JavaScript és millor.
Pots aprofundir en la gestió tècnica de variants i paràmetres a la nostra guia de SEO tècnic per a botigues en línia.
Canonical tags en ecommerce: implementació sense errors
L’etiqueta canonical (<link rel="canonical" href="...">) és l’eina principal per gestionar duplicats sense eliminar URLs que tenen valor funcional. Però usar-la malament pot ser pitjor que no usar-la.
Els errors més comuns en implementacions de canonical en ecommerce:
Canonical a si mateixa en pàgines d’error. Si una pàgina 404 o redirigida té una canonical self-referencing, estàs dient a Google que indexi una pàgina que no existeix o que redirigeix. Revisa que les teves plantilles d’error no heretin la canonical del sistema de forma automàtica.
Canonical inconsistent amb hreflang. Si tens la mateixa botiga en múltiples idiomes i les etiquetes hreflang apunten a una URL mentre la canonical apunta a una altra, Google rep senyals contradictoris. Aprèn a gestionar-ho a la nostra guia sobre SEO internacional per a ecommerce.
Canonical en pàgines paginades apuntant a page/1. Si tens /samarretes/page/1/ i /samarretes/, la primera hauria de redirigir a la segona amb un 301, perquè representen el mateix contingut. Cada pàgina paginada ha de tenir canonical self-referencing: /samarretes/page/2/ apunta a si mateixa, /samarretes/page/3/ apunta a si mateixa. No facis que totes les pàgines paginades apuntin a la primera pàgina, perquè això li diu a Google que les pàgines 2, 3, 4… són duplicats de la primera, la qual cosa no és certa i pot provocar que els productes de pàgines profundes deixin de ser indexats.
Cadenes de canonicals. Si A apunta a B i B apunta a C, Google pot no seguir la cadena completa. Les canonicals han d’apuntar directament a la URL final.
La implementació correcta a la pràctica: cada URL que no vols que Google indexi com a versió preferida ha de declarar la URL que sí vols com a canonical. Això inclou pàgines amb paràmetres de filtre, variants de producte, pàgines paginades i versions amb paràmetres de seguiment.
Paginació: el duplicat que ningú vol atacar primer
La paginació és el duplicat amb el qual més botigues conviuen en pau durant anys perquè no sembla urgent. Les categories paginades continuen funcionant, continuen sent rastrejades, i el negoci no cau. Però hi ha un cost silenciós: el pressupost de rastreig es gasta en pàgines que no aporten trànsit, i els senyals d’autoritat es fragmenten entre vint pàgines d’una mateixa categoria en lloc de concentrar-se en una.
Google va deixar de donar suport a rel=prev/next el març del 2019. Des de llavors, la gestió de paginació correcta depèn de:
Canonical tags self-referencing en cada pàgina paginada (cada /categoria/page/N/ apunta a si mateixa, no a la pàgina 1). Això evita que Google col·lapsi totes les pàgines en una sola i perdis els productes indexats en pàgines profundes.
Sitemap complet que inclogui els productes de totes les pàgines paginades directament. Si /categoria/page/5/ conté productes que no apareixen en cap altre lloc, inclou-los al sitemap directament com a URLs de producte, no com a pàgines paginades.
Scroll infinit o “carregar més” com a alternativa. Si la teva botiga usa scroll infinit amb JavaScript, assegura’t que els productes carregats dinàmicament siguin rastrejables. La solució recomanada per Google és implementar URLs amb fragments paginats (com ?page=2) que serveixen el contingut sense JavaScript quan Googlebot les accedeix directament.
Eines d’auditoria i procés de diagnòstic
El diagnòstic de contingut duplicat requereix dades reals, no suposicions. El procés recomanat té tres fases.
Fase 1: Rastreig tècnic. Usa Screaming Frog o Sitebulb per rastrejar la teva botiga completa. Configura el rastreig per a que segueixi paràmetres d’URL i exporta l’informe d’URLs duplicades (pàgines amb el mateix títol, la mateixa descripció meta o el mateix contingut). L’informe et donarà una imatge de la magnitud del problema.
Fase 2: Validació a Google Search Console. A l’informe de Cobertura, busca el nombre total d’URLs indexades. Compara’l amb el nombre d’URLs que realment has dissenyat per ser indexades. Una diferència gran (més del 50%) és senyal que hi ha duplicats sent indexats. L’eina d’Inspecció d’URL et permet verificar quina versió d’una URL específica té indexada Google i quina és la seva canonical declarada vs. la canonical detectada.
Fase 3: Priorització per impacte. No tots els duplicats són iguals. Prioritza els que afecten pàgines d’alt trànsit potencial (categories principals, productes estrella) sobre els que afecten variants o productes de cua llarga amb poc volum de cerca.
Eines complementàries: Ahrefs Site Audit detecta inconsistències de canonical i pàgines amb contingut similar. SEMrush Site Audit té un mòdul específic de contingut duplicat que analitza similitud textual. Siteliner és gratuït i cobreix anàlisi bàsica de contingut duplicat intern.
El procés complet d’auditoria tècnica es detalla a la guia principal de SEO tècnic per a ecommerce, on també trobaràs checklists d’implementació per a cadascuna d’aquestes eines.
Quan el noindex és la solució correcta
Hi ha situacions on ni la canonical tag ni reescriure el contingut és l’opció òptima. El noindex —afegit com a meta tag al <head> o com a capçalera HTTP— li diu a Google directament “no incloguis aquesta URL al teu índex”.
Els candidats clars per a noindex en ecommerce:
Pàgines de resultat de cerca interna (/search?q=samarreta). Són pàgines dinàmiques sense valor SEO propi que generen URLs infinites.
Pàgines de carret, checkout, compte d’usuari, confirmació de comanda. Cap d’aquestes té valor de posicionament i exposar la seva existència pot ser un problema de seguretat.
Pàgines de variants de producte sense diferenciació significativa de contingut quan l’alternativa (canonical) no és suficient o hi ha raons tècniques per mantenir les URLs separades.
Pàgines de resultats de filtres molt específics que no corresponen a cap volum de cerca real (per exemple, /samarretes/?talla=XXL&color=beix&màniga=curta).
La distinció important: noindex i canonical no són equivalents. Una canonical tag li diu a Google “prefereixo aquesta URL”. Un noindex li diu “aquesta URL no hauria d’estar a l’índex”. Per a variants de producte, la canonical és generalment més apropiada perquè manté la URL rastrejable i passa senyals. Per a pàgines funcionals sense valor SEO, el noindex és més directe.
El camí pragmàtic: prioritzar sense paralitzar-se
Si has arribat fins aquí i estàs mirant la teva botiga amb una mena de vertigen, la perspectiva correcta és aquesta: no necessites resoldre tots els duplicats alhora. El contingut duplicat en ecommerce és un problema de gestió contínua, no un sprint de correcció única.
L’ordre de prioritat que funciona a la pràctica:
-
Configura els redirects 301 per consolidar variants d’URL tècniques (www/no-www, http/https, trailing slash). Una tarda de feina, impacte immediat.
-
Implementa canonical tags a les pàgines amb paràmetres de filtre i pàgines paginades. Per a filtres sense demanda de cerca (combinacions molt específiques sense volum), apunta la canonical a la URL base de la categoria. Per a filtres amb demanda de cerca demostrada (per exemple, «samarretes de cotó» o «sabates de running»), permet que siguin pàgines indexables amb canonical propi. Per a pàgines paginades, usa canonical self-referencing (cada pàgina apunta a si mateixa). Això es pot automatitzar a la plantilla de la teva plataforma.
-
Treballa les descripcions originals començant pels 50-100 productes que més trànsit potencial tenen. Mesura l’impacte tres mesos després i decideix si ampliar.
-
Revisa Google Search Console mensualment per detectar noves inflacions d’URLs indexades que senyalin problemes emergents.
La millora incremental consistent supera el sprint perfecte que mai s’executa. La botiga que resol el 80% del problema en quatre setmanes té avantatge sobre la que porta sis mesos planificant la solució perfecta.
Per implementar correctament les canonical tags en tots aquests escenaris, et recomanem revisar també la nostra guia específica sobre canonical tags en ecommerce, on trobaràs plantilles d’implementació per a Shopify, WooCommerce i Magento.