Hi ha un problema SEO que no apareix a cap informe d’errors i que Google no notifica a Search Console: el contingut duplicat tècnic que el teu propi CMS o infraestructura genera automàticament. Un comerç electrònic sense configuració específica, una botiga amb filtres de color i talla, pot convertir deu pàgines de producte en uns quants centenars d’URLs indexables en qüestió de setmanes. Totes amb el mateix contingut. Totes competint en silenci per la mateixa autoritat.
El contingut duplicat tècnic — el text idèntic o quasi idèntic distribuït a múltiples URLs — és un dels problemes de SEO tècnic més freqüents i menys visibles. A diferència d’un error 404 o d’un títol massa llarg, no activa cap alerta. Simplement dilueix el teu PageRank de manera gradual fins que cap de les URLs afectades arriba al seu potencial de posicionament real.
Aquesta guia diferencia el contingut duplicat de la canibalització de paraules clau (són problemes diferents), explica els orígens tècnics més freqüents i estableix un pla d’acció concret per resoldre’l sense perdre rankings en el procés.
Contingut duplicat vs canibalització: la diferència crítica que tothom confon
Abans d’entrar en les solucions, cal separar dos conceptes que es barregen amb freqüència fins i tot en fonts de referència del sector.
El contingut duplicat és text idèntic o substancialment similar que apareix a dues o més URLs. El problema és purament de senyal tècnica: Google rep el mateix contingut des de múltiples adreces, no sap quina mostrar com a versió canònica i reparteix l’autoritat entre totes. No hi ha diferència d’intenció editorial entre les URLs — simplement el mateix contingut existeix en diversos llocs.
La canibalització de paraules clau és un problema d’intenció de cerca. Dues pàgines amb contingut diferent competeixen per posicionar-se per a la mateixa consulta perquè Google les interpreta com a respostes equivalents a la mateixa intenció. El contingut pot ser completament original a cada pàgina — el problema no és el text, sinó la superposició de senyals de rellevància per a la mateixa consulta.
Un lloc pot tenir un sense l’altre. Un blog amb una versió imprimible dels seus articles — /article/ i /article/imprimir/ — té contingut duplicat però no canibalització si la versió imprimible té un canònic correcte. Un blog amb dues guies diferents sobre “eines SEO” té canibalització però no contingut duplicat si cada guia té contingut original.
Confondre els dos problemes porta a aplicar solucions incorrectes. L’etiqueta canònica resol el contingut duplicat tècnic; no resol la canibalització entre pàgines amb contingut diferent. Les redireccions 301 poden resoldre la canibalització; aplicar-les a versions tècniques necessàries (impressió, UTM) trenca funcionalitat sense necessitat. Identificar correctament el tipus de problema és el primer pas del diagnòstic.
La guia sobre canibalització de paraules clau desenvolupa en detall el diagnòstic i les quatre estratègies per resoldre aquell problema específic quan les pàgines tenen contingut diferent però competeixen pel mateix intent.
Tipus de contingut duplicat: intern, extern i tècnic
Hi ha tres categories principals de contingut duplicat, cadascuna amb causes i solucions diferents.
Duplicat intern
El mateix contingut existeix a múltiples URLs del mateix domini. És el més comú i el que té més impacte en SEO perquè divideix directament l’autoritat del propi domini. Les causes més habituals:
- Versions de protocol:
http://domini.com/pagina/ihttps://domini.com/pagina/són URLs diferents per a Google si no hi ha una redirecció 301 des de HTTP cap a HTTPS correctament configurada. - Versions www i non-www:
www.domini.com/pagina/idomini.com/pagina/són dues URLs diferents. Sense un canònic o redirecció que consolidi les dues versions, Google tria quina indexar de manera autònoma i pot triar la versió incorrecta. - Barra final (trailing slash):
/paginai/pagina/són tècnicament diferents. A la majoria de marcs de treball i CMSs moderns estan configurats com a equivalents, però en configuracions antigues o personalitzades poden ser independents. - Paràmetres de sessió o seguiment: URLs generades pel sistema amb paràmetres com
?sessionid=,?ref=,?source=. Cada variant és una nova URL per al rastrejador de Google.
Duplicat extern
El mateix contingut apareix a dominis diferents. Les causes inclouen:
- Sindicació sense canònic: Un article publicat al lloc original i replicat a plataformes de sindicació (Medium, LinkedIn Pulse, llocs d’afiliats) sense que la còpia indiqui el canònic que apunti a l’original.
- Rascat (scraping): Altres llocs copien el teu contingut sense permís. Google sol identificar l’original correctament per les dates de primera indexació, però en dominis amb més autoritat que el teu pot indexar la còpia en lloc de l’original.
- Contingut del proveïdor en comerç electrònic: Fitxes de producte amb les descripcions literals del fabricant, usades també per altres distribuïdors. Dotzenes de llocs publiquen exactament el mateix text per al mateix producte.
Duplicat tècnic
Generat per l’arquitectura del lloc, no per decisions editorials. El més subestimat en termes de volum perquè s’escala automàticament:
- Paginació:
/blog/,/blog/page/2/,/blog/page/3/. Les pàgines de paginació a partir de la segona comparteixen el mateix H1 i estructura que la primera, amb contingut diferent però metadades idèntiques. - Paràmetres de filtre i ordenació: El cas més greu en comerç electrònic. Una categoria amb filtres de color, talla, preu i marca pot generar milers de combinacions d’URL amb el mateix contingut base.
- Versions d’impressió:
/article/?print=1o/imprimir/article/amb el mateix contingut que la versió original. - Arxius de data a WordPress: Les pàgines d’arxiu per data (
/2024/03/,/2024/03/15/) i per categoria poden duplicar el contingut dels posts individuals.
Com detectar el contingut duplicat amb les eines correctes
El diagnòstic eficaç combina dades de rastreig (el que veu el bot) amb dades d’indexació (el que té Google al seu índex).
Google Search Console: el punt de partida obligatori
A GSC, ve a Indexació > Pàgines. El tauler mostra l’estat d’indexació de totes les URLs detectades. Els estats més rellevants per detectar duplicats:
- “Pàgina duplicada sense canònic seleccionat per l’usuari”: Google ha detectat pàgines amb contingut quasi idèntic i ha triat per compte seu quina indexar. Si la URL que ha triat no és la que vols com a canònica, has d’implementar un canònic explícit.
- “URL duplicada, la URL canònica de Google és diferent de l’especificada per l’usuari”: Tens un canònic declarat però Google no el respecta. Això sol passar perquè considera que les pàgines tenen diferències suficients per no ser duplicades, o perquè hi ha senyals contradictòries (per exemple, la URL no-canònica té més enllaços externs).
- “Rastreejat, no indexat actualment”: No necessàriament duplicats, però moltes vegades les pàgines no indexades ho són perquè Google ha preferit indexar una altra versió.
Screaming Frog: rastreig complet amb detecció de duplicats
Screaming Frog SEO Spider és l’estàndard del sector per detectar contingut duplicat a nivell tècnic. El procés:
- Rastreja el lloc complet (Configuration > Spider > All).
- Ve a la pestanya Content i filtra per “Duplicate”.
- L’informe mostra grups d’URLs amb el mateix hash de contingut (duplicat exacte) o percentatge alt de similitud (duplicat parcial).
- Exporta l’informe i agrupa per hash per veure quantes URLs comparteixen exactament el mateix contingut.
L’informe de títols de pàgina duplicats i d’H1 duplicats és especialment revelador: dues pàgines amb el mateix H1 exacte són pràcticament sempre un cas de contingut duplicat o canibalització.
La versió gratuïta de Screaming Frog limita el rastreig a 500 URLs. La versió de pagament (£259/any) permet rastrejos il·limitats amb detecció de similitud de contingut basada en hash complet — imprescindible per a llocs amb milers de pàgines.
Semrush Site Audit i Ahrefs Site Audit
Semrush Site Audit inclou un mòdul específic de contingut duplicat a la secció Issues > Warnings. Detecta automàticament:
- Pàgines amb el mateix títol.
- Pàgines amb la mateixa metadescripció.
- Pàgines amb contingut intern duplicat per sobre d’un llindar configurable.
Ahrefs Site Audit fa la mateixa anàlisi a la secció Content Quality > Duplicate Content. Un avantatge d’Ahrefs és que creua les dades de contingut duplicat amb les dades d’enllaços: pots veure immediatament quines URLs duplicades tenen enllaços externs, cosa que és crucial per decidir quina versió consolidar.
Siteliner: detecció de duplicats interns en un clic
Siteliner (siteliner.com) és una eina gratuïta especialitzada en detectar contingut duplicat intern. Introdueix el teu domini i el sistema rastreja fins a 250 pàgines en la versió gratuïta, mostrant el percentatge de contingut comú entre pàgines. És útil com a diagnòstic ràpid abans d’una auditoria més profunda amb Screaming Frog.
Paràmetres d’URL: la font de duplicació més subestimada
Els paràmetres d’URL són la causa més freqüent de contingut duplicat massiu no intencionat, especialment en comerç electrònic i llocs amb cerca interna.
Quan un catàleg de productes té filtres combinables — per exemple, color, talla, preu, marca i valoració — cada combinació possible genera una URL diferent. Un catàleg amb 5 filtres binaris pot generar fins a 2⁵ = 32 variants d’URL per a la mateixa categoria. Amb filtres de múltiples valors, el nombre creix exponencialment.
El problema no és només la duplicació de contingut sinó el consum de pressupost de rastreig. Com assenyala la documentació oficial de Google Search Central sobre paràmetres d’URL: “Els paràmetres poden crear URLs que mostren contingut duplicat o que varien lleugerament del contingut d’altres URLs.” Googlebot rastreja totes aquestes variants, consumint pressupost de rastreig que podria dedicar a pàgines amb contingut únic.
Les solucions més efectives per als paràmetres d’URL:
Canònic a cada URL parametritzada: Cada URL amb paràmetres inclou un <link rel="canonical"> que apunta a la URL neta de la categoria. Aquesta és la solució estàndard per a llocs on els filtres són funcionals per a l’usuari però no han de generar URLs independents a l’índex.
<!-- A /productes/sabatilles/?color=vermell&talla=42 -->
<link rel="canonical" href="https://lamiabotiga.com/productes/sabatilles/" />
Gestió de paràmetres d’URL amb canònic i robots.txt: Google va retirar l’eina de paràmetres d’URL de Search Console l’abril del 2022. L’enfocament actual recomanat és usar etiquetes canòniques a cada URL parametritzada per consolidar les senyals d’indexació, bloquejar patrons de paràmetres no desitjats via robots.txt (per exemple, Disallow: /*?sessionid=), configurar hreflang per a variants de locale, i confiar en la gestió automàtica de paràmetres que fa Google — el canònic continua sent el mecanisme més fiable per indicar la URL preferida.
Robots.txt per a paràmetres de sessió: Els paràmetres de sessió o seguiment que no tenen cap valor per als usuaris ni per al rastreig es poden bloquejar a robots.txt. Atenció: bloquejar a robots.txt no desindexar URLs ja indexades — només impedeix el rastreig futur.
Pàgines de resultats de cerca interna: Les URLs generades per la cerca interna del lloc (/cercar/?q=sabatilles+vermelles) s’han de bloquejar sistemàticament a robots.txt o amb una etiqueta meta robots noindex. Google ha indicat explícitament que indexar pàgines de resultats de cerca interns no és una pràctica recomanada.
L’etiqueta canònica: quan usar-la i quan no és suficient
L’etiqueta canònica (<link rel="canonical">) és el mecanisme principal per consolidar les senyals SEO quan existeixen múltiples versions de la mateixa URL. Però té limitacions importants que s’ignoren amb freqüència.
Com funciona: La pàgina no canònica inclou al seu <head> el canònic que apunta a la versió que ha d’indexar Google. Google consolida les senyals de les dues pàgines (enllaços externs, dades d’interacció) a la URL canònica. La URL no canònica continua sent accessible per als usuaris.
<!-- Versió imprimible de l'article -->
<head>
<link rel="canonical" href="https://ighenatt.es/ca/blog/el-meu-article/" />
</head>
<!-- Versió amb paràmetres UTM -->
<head>
<link rel="canonical" href="https://ighenatt.es/ca/landing/la-meva-landing/" />
</head>
Quan l’etiqueta canònica és la solució correcta:
- Versions imprimibles d’articles que han de continuar sent accessibles.
- URLs amb paràmetres UTM per al seguiment de campanyes.
- Pàgines de producte amb paràmetres d’atributs (color, talla) en comerç electrònic.
- Versions HTTP de pàgines quan la redirecció 301 no és disponible temporalment.
- Llocs que serveixen el mateix contingut en múltiples dominis (per exemple, versions regionals amb el mateix contingut).
Quan l’etiqueta canònica NO és suficient:
Com va explicar John Mueller, Search Advocate de Google, en una sessió de Google Search Central Live: “El canònic és una indicació forta, no una directiva. Google pot decidir no respectar-lo si considera que té raons per triar una altra URL.” Això passa especialment quan la URL no canònica té significativament més enllaços externs que la canònica declarada, o quan el contingut de les dues pàgines té diferències substancials que Google interpreta com a pàgines diferents.
Per a contingut veritablement duplicat on cap URL ha d’estar accessible de manera independent, la redirecció 301 sempre és més neta i més eficaç: és una directiva, no una suggerència, i elimina la URL duplicada de l’índex de manera definitiva.
Canònic auto-referencial: Cada pàgina ha de tenir un canònic que s’apunti a si mateixa. Aquest canònic auto-referencial confirma a Google que aquesta URL és la versió canònica i evita ambigüitats quan els paràmetres d’URL podrien interpretar-se com a variants.
<!-- A /blog/el-meu-article/ -->
<head>
<link rel="canonical" href="https://ighenatt.es/ca/blog/el-meu-article/" />
</head>
Contingut duplicat en comerç electrònic: el cas més complex
El comerç electrònic és l’escenari on el contingut duplicat arriba a la seva major escala i on l’impacte en el negoci és més directe. Un catàleg gran sense una gestió correcta de duplicats pot tenir més URLs duplicades que pàgines úniques.
Descripcions de producte del fabricant
El problema més estès entre distribuïdors i retailers: fer servir les descripcions literals del fabricant. Quan vint distribuïdors publiquen exactament la mateixa descripció per al mateix producte, Google indexa una d’elles — normalment la del fabricant o el retailer amb més autoritat — i ignora les altres.
Escriure descripcions originals per a cada producte és la solució òptima però no sempre escalable. Per a catàlegs de milers de referències, l’estratègia més pràctica és prioritzar: escriure contingut original per als productes amb més trànsit o més marge, i implementar plantilles amb variacions de text per a la resta. Fins i tot petites variacions al primer paràgraf i als punts de característiques redueixen significativament el percentatge de text idèntic.
Pàgines de producte amb variants de color i talla
El patró més comú en moda i tecnologia: /sabatilles-model-x/, /sabatilles-model-x/?color=vermell, /sabatilles-model-x-vermell/. Tres URLs, mateix producte, mateixa descripció amb variacions mínimes.
L’arquitectura correcta depèn del volum de cerques per variant. Si “sabatilles model x vermell” té volum de cerca rellevant, es pot justificar una URL pròpia amb contingut específic. Si el volum és marginal, la variant hauria de ser una opció de la fitxa principal amb un canònic que apunti a la URL base del model.
Paginació de categories
/sabates/, /sabates/?page=2, /sabates/?page=3. Les pàgines de paginació no s’han d’indexar de manera independent: l’H1 és el mateix, la metadescripció és idèntica, i el contingut de cada pàgina és simplement una subsecció del llistat total.
La solució estàndard és un canònic des de totes les pàgines de paginació cap a la primera pàgina de la categoria. Google pot rastrejar les pàgines paginades per descobrir productes, però la senyal d’indexació es consolida a la URL de la primera pàgina.
Segons dades publicades per Semrush en la seva anàlisi dels errors SEO més comuns en comerç electrònic (2024), la paginació sense gestió de canònics és el tercer problema tècnic més freqüent en botigues en línia, present al 47% dels llocs auditats amb més de 1.000 pàgines.
Pla d’acció per resoldre el contingut duplicat sense perdre rankings
L’ordre d’intervenció és tan important com les solucions tècniques. Actuar en l’ordre incorrecte pot consolidar l’autoritat a la URL equivocada.
Pas 1: Inventari complet abans de qualsevol canvi
Abans d’implementar una sola etiqueta canònica o redirecció, necessites el mapa complet del problema. Rastreja el lloc amb Screaming Frog i exporta:
- Totes les URLs amb el mateix hash de contingut (duplicats exactes).
- Totes les URLs amb títol duplicat.
- Totes les URLs amb metadescripció duplicada.
- Totes les URLs amb més del 80% de contingut similar.
Per a cada grup de duplicats, identifica: quantes URLs té el grup, quina té més enllaços externs de dominis únics (usant Ahrefs o Semrush), quina té més trànsit històric (usant GSC), i quina s’ha declarat com a canònica al codi actual.
Pas 2: Decidir la URL guanyadora per grup
Per a cada grup de duplicats, tria la URL guanyadora seguint aquest criteri de prioritat:
- La URL amb més dominis de referència únics.
- Si hi ha empat, la URL amb més trànsit en els últims 12 mesos segons GSC.
- Si hi ha empat, la URL més curta i semànticament neta.
No triïs la URL guanyadora per criteris estètics o d’estructura ideal. La URL amb més autoritat acumulada ha de ser sempre la destinació — pots ajustar l’estructura després de la consolidació amb una redirecció addicional si és necessari.
Pas 3: Implementar en aquest ordre
- Canònic auto-referencial a la URL guanyadora: Primer de tot, assegura’t que la URL que vols conservar té un canònic que s’apunti a si mateixa.
- Canònic a les URLs no canòniques (si han de continuar sent accessibles).
- Redirecció 301 des d’URLs duplicades que no han d’estar accessibles.
- Actualitzar els enllaços interns: Canvia tots els enllaços interns que apunten a URLs duplicades perquè apuntin directament a la URL guanyadora. Aquest pas l’omet quasi tothom i és el que genera cadenes de redirecció innecessàries.
- Actualitzar el mapa del lloc (sitemap): Inclou només les URLs canòniques. No incloguis mai al sitemap URLs amb canònic declarat a una altra adreça.
Pas 4: Verificar a GSC durant 4-8 setmanes
Després d’implementar els canvis, supervisa l’informe d’Indexació > Pàgines a GSC. L’estat “Pàgina duplicada sense canònic seleccionat per l’usuari” ha d’anar reduint-se. El procés de re-rastreig i re-indexació pot trigar entre 2 i 8 setmanes depenent del pressupost de rastreig del lloc i la freqüència amb què Google el visita.
Si després de 8 setmanes Google continua ignorant els teus canònics en un grup d’URLs, comprova:
- Les URLs no canòniques tenen més enllaços externs que la canònica? Potser necessites una redirecció 301 en lloc d’un canònic.
- Hi ha prou diferència de contingut entre les URLs perquè Google no les consideri duplicades? L’etiqueta canònica només funciona quan Google determina que el contingut és substancialment similar.
La guia sobre redireccions 301 i 302 detalla el funcionament tècnic de les redireccions i els errors d’implementació més costosos — especialment rellevant per al pas de consolidació d’URLs duplicades.
Si el diagnòstic del contingut duplicat revela problemes més amplis d’arquitectura — paràmetres d’URL que proliferen, paginació sense gestió, versions HTTP/HTTPS sense resoldre — és probable que et trobis davant d’un problema sistèmic que requereix una auditoria tècnica completa. A Ighenatt auditem la gestió del contingut duplicat com a part del procés de diagnòstic SEO tècnic: identifiquem el volum real del problema, prioritzem les intervencions per impacte potencial i definim el pla d’implementació correcte per no trencar res en el procés.
Comparteix aquest article
Si t'ha resultat útil aquest contingut, comparteix-lo amb els teus col·legues.
Preguntes Freqüents
¿Con qué frecuencia publican contenido nuevo?
Publicamos artículos nuevos semanalmente, enfocados en las últimas tendencias de SEO técnico, casos de estudio reales y mejores prácticas. Suscríbete a nuestro newsletter para no perderte ninguna actualización.
¿Los consejos son aplicables a cualquier tipo de sitio web?
Nuestros consejos se adaptan a diferentes tipos de sitios: ecommerce, blogs, sitios corporativos y aplicaciones web. Siempre indicamos cuándo una técnica es específica para cierto tipo de sitio o requerimientos técnicos.
¿Puedo implementar estas técnicas yo mismo?
Muchas técnicas básicas puedes implementarlas tú mismo siguiendo nuestras guías paso a paso. Para optimizaciones avanzadas o auditorías completas, recomendamos consultar con especialistas en SEO técnico como nuestro equipo.
¿Ofrecen servicios de consultoría personalizada?
Sí, ofrecemos servicios de consultoría SEO técnica personalizada, auditorías completas y optimización integral. Contáctanos para discutir las necesidades específicas de tu proyecto y cómo podemos ayudarte.