Saltar al contingut principal
SEO Tecnico 9 min

Sitemaps XML: guia tècnica perquè Google indexi el teu contingut | Ighenatt

Tipus de sitemap, estructura correcta, camps que Google ignora i com enviar-los a GSC. Tot el que necessites perquè Googlebot trobi les teves pàgines.

EG

Elu Gonzalez

Autor

Hi ha un malentès persistent sobre els sitemaps: molta gent els crea una vegada, els puja a Search Console i dona per fet que Google indexarà tot el contingut. La realitat és més matisada. Google tracta el sitemap com un suggeriment, no com una ordre. I hi ha condicions concretes en les quals l’ignora completament.

El sitemap XML és el mapa que entregues a Googlebot quan arriba al teu lloc. Si el mapa està ben traçat, inclou les rutes correctes i assenyala les destinacions més importants, Googlebot pot fer la seva feina amb eficiència. Si el mapa té errors, inclou carrers tallats o apunta a llocs que ja no existeixen, Googlebot el descarta i busca el seu propi camí, que pot conduir o no al que més t’importa.

Aquesta guia cobreix el que realment necessites saber: tipus de sitemap, quins camps llegeix Google i quins ignora, com funcionen els sitemaps per a contingut multimèdia, com generar-los a les plataformes més habituals i com enviar-los i fer el seguiment del seu estat a Google Search Console.

Tipus de sitemap XML: quin necessita el teu lloc

No existeix un únic tipus de sitemap. El protocol estàndard de sitemaps.org, adoptat per Google, Bing i Yahoo el 2006, defineix el format base, i Google ha desenvolupat extensions per a tipus de contingut específics.

El sitemap XML estàndard llista URLs de pàgines web amb metadades opcionals. És el tipus més comú i el punt de partida per a qualsevol lloc. Si tens un blog, un lloc web corporatiu o un ecommerce sense contingut multimèdia especialitzat, aquest és l’únic que necessites.

Els sitemaps d’imatges permeten a Google descobrir imatges que el rastreig ordinari no podria trobar, especialment les que es carreguen mitjançant JavaScript. No substitueixen el sitemap principal: s’afegeixen com una extensió dins del mateix arxiu o en un arxiu separat. Cada URL pot incloure fins a 1.000 referències d’imatge.

Els sitemaps de vídeo funcionen de manera similar però per a contingut audiovisual. Inclouen camps específics com la durada (en segons, entre 1 i 28.800), la data de publicació, la puntuació i les restriccions geogràfiques. Són especialment importants si vols que els teus vídeos apareguin a Google Vídeos.

Els sitemaps de notícies són per a publicacions de Google News. Tenen una restricció temporal important: només han de contenir articles publicats en els darrers dos dies. Superada aquesta finestra, els articles s’han d’eliminar del sitemap de notícies encara que continuïn al lloc. El límit és de 1.000 URLs per arxiu, molt més baix que l’estàndard.

Quin necessites? La resposta depèn del teu contingut. Un blog estàndard o lloc corporatiu: sitemap XML estàndard. Un lloc amb fotografies o galeries d’imatges: sitemap d’imatges. Un canal de vídeo o curs en línia: sitemap de vídeo. Un mitjà de comunicació: sitemap de notícies a més de l’estàndard.

Estructura tècnica d’un sitemap XML: els camps que Google llegeix i els que ignora

El protocol sitemaps.org defineix quatre camps possibles dins de cada entrada <url>. Saber quins utilitza Google i quins descarta estalvia temps i evita confusions.

<loc> és l’únic camp obligatori. Ha de contenir la URL completa, incloent el protocol, el domini i la barra final si el teu servidor la requereix. La URL no pot superar els 2.048 caràcters. Tots els caràcters especials (ampersands, cometes, claudàtors angulars) s’han d’escapar amb entitats XML.

<lastmod> és l’únic camp opcional que Google utilitza, i amb condicions. Si la data que proporciones reflecteix genuïnament quan va canviar el contingut de la pàgina, Google l’utilitza per prioritzar el rastreig de pàgines actualitzades. Si la data és incorrecta, sempre la mateixa o generada automàticament sense canvis reals, Google deixa de fiar-se del camp per al teu lloc. La precisió importa més que la presència.

<changefreq> i <priority> són camps que Google ignora explícitament. La documentació oficial ho confirma sense ambigüitats. Que els incloguis o no al teu sitemap no canvia res des del punt de vista de Google. Alguns generadors els inclouen per compatibilitat amb altres cercadors o per inerència històrica, però per al rastreig de Google no tenen cap efecte.

Un sitemap XML vàlid i mínim té aquesta estructura:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://exemple.com/pagina/</loc>
    <lastmod>2026-03-15</lastmod>
  </url>
  <url>
    <loc>https://exemple.com/altra-pagina/</loc>
    <lastmod>2026-04-01</lastmod>
  </url>
</urlset>

Per a llocs amb més de 50.000 URLs o arxius que superen els 50MB sense comprimir, cal un sitemap index. Aquest arxiu actua com a índex que referencia múltiples arxius de sitemap individuals:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://exemple.com/sitemap-blog.xml</loc>
    <lastmod>2026-04-01</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://exemple.com/sitemap-productes.xml</loc>
    <lastmod>2026-04-01</lastmod>
  </sitemap>
</sitemapindex>

Un sitemap index pot referenciar fins a 50.000 sitemaps individuals. Si tens un ecommerce amb milions de productes, els pots distribuir en múltiples arxius que l’index referencia.

Errors que fan que Google ignori el teu sitemap

Gary Illyes, analista de tendències a Google, ha estat directe en el podcast Search Off the Record: els sitemaps amb massa URLs d’error o amb dates de lastmod incorrectes acaben sent ignorats per Google, que aprèn a desconfiar del senyal. La precisió té més valor que la completesa, i aquest principi guia totes les decisions sobre què incloure.

Els errors més habituals que degraden la utilitat del sitemap són concrets i evitables.

Incloure URLs que retornen 3xx o 4xx és l’error més freqüent. Si una URL del teu sitemap respon amb 301, 302 o 404, Google gasta recursos en una visita que no acaba en contingut indexable. Tota auditoria tècnica amb Screaming Frog en llocs amb problemes d’indexació mostra aquest patró: entre el 5% i el 30% de les URLs del sitemap apunten a pàgines redirigides o eliminades. El sitemap ha d’incloure exclusivament URLs amb resposta 200.

Incloure pàgines amb noindex és un altre error habitual. Si una pàgina té la directiva noindex a l’HTML, incloure-la al sitemap envia senyals contradictòries: el sitemap diu “indexa això” i l’HTML diu “no ho indexis”. Google sol respectar el noindex, però la contradicció consumeix rastreig innecessàriament.

Dates de <lastmod> estàtiques o incorrectes. Alguns generadors de sitemaps posen la data de generació del sitemap com a lastmod de totes les URLs, encara que les pàgines no hagin canviat. Google detecta aquest patró i deixa d’utilitzar el camp lastmod d’aquell domini com a senyal de frescor.

URLs de contingut duplicat o pàgines canòniques no principals. Si tens versions /ca/ i /es/ del mateix contingut, el sitemap ha d’incloure només les URLs canòniques de cada versió, no totes les variants. De la mateixa manera, les pàgines amb paràmetres d’URL que són variants d’una pàgina principal s’han d’excloure si no són les canòniques.

Sitemaps mai actualitzats. Un sitemap que no canvia en mesos, encara que el lloc sí canviï, perd rellevància. Google redueix la freqüència amb la qual el consulta perquè aprèn que no aporta informació nova.

Sitemaps per a diferents plataformes: Astro, WordPress, Next.js

La generació del sitemap varia segons la plataforma. Saber com funciona cada una evita configuracions manuals innecessàries i errors d’implementació.

A WordPress, els connectors Yoast SEO i RankMath generen sitemaps automàticament i els mantenen actualitzats. Yoast genera un sitemap index a /sitemap_index.xml que divideix el contingut per tipus (entrades, pàgines, categories, autors). RankMath fa una cosa similar a /sitemap.xml. Tots dos exclouen automàticament pàgines amb noindex i permeten configurar quins tipus de contingut apareixen. El problema més freqüent a WordPress és incloure pàgines d’autor o d’arxiu d’etiquetes amb poc contingut únic; val la pena revisar quins tipus inclou el connector i desactivar els que no aporten valor.

A Astro, la integració oficial @astrojs/sitemap genera el sitemap automàticament durant el procés de construcció. Es configura a astro.config.mjs amb opcions per filtrar URLs, personalitzar el lastmod i dividir en múltiples arxius per a llocs grans. Per a llocs estàtics amb output: "static", el sitemap es genera durant la construcció i es publica amb la resta del lloc. Per a sitemaps d’imatges o hreflang en llocs multilingüe, la configuració requereix passar les opcions corresponents a la integració.

A Next.js, la biblioteca next-sitemap és la més utilitzada per generar sitemaps després de la construcció. Es configura amb un arxiu next-sitemap.config.js que controla quines rutes incloure, quines excloure i si generar sitemaps separats per secció. Next.js 13+ amb App Router té suport natiu per a sitemaps mitjançant l’arxiu sitemap.ts al directori app/, que exporta una funció que retorna l’array d’URLs.

Per a llocs estàtics sense framework o amb generadors com Hugo o Eleventy, el sitemap s’ha de generar com a part del procés de construcció o mantenir manualment. L’opció manual només és viable per a llocs amb menys de 100 URLs que rarament canvien.

Sitemaps d’imatges i vídeos: indexació de contingut multimèdia

Els sitemaps multimèdia mereixen atenció específica perquè tenen un impacte desproporcionat en la visibilitat de certs tipus de contingut.

El sitemap d’imatges és especialment útil per a fotografies de producte, galeries, portafolis i qualsevol imatge carregada amb JavaScript o amb càrrega diferida agressiva. Googlebot pot tenir dificultats per descobrir imatges que només es carreguen després d’interaccions de l’usuari o que es troben en components renderitzats al client. El sitemap d’imatges resol aquest problema directament.

L’estructura d’una extensió d’imatge dins del sitemap estàndard és:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>https://exemple.com/producte/samarreta-blava/</loc>
    <image:image>
      <image:loc>https://exemple.com/imatges/samarreta-blava-frontal.jpg</image:loc>
    </image:image>
    <image:image>
      <image:loc>https://exemple.com/imatges/samarreta-blava-detall.jpg</image:loc>
    </image:image>
  </url>
</urlset>

Els camps <image:caption>, <image:title>, <image:geo_location> i <image:license> han estat eliminats de l’especificació oficial de Google. Només <image:loc> és necessari.

Per al sitemap de vídeo, els camps obligatoris són la miniatura, el títol, la descripció i almenys una de les dues ubicacions del contingut (l’arxiu de vídeo o la URL del reproductor). Els camps opcionals com la durada i la data de publicació milloren com Google mostra el resultat en els resultats de vídeo.

Un punt que sovint s’ignora: les URLs del sitemap d’imatges i vídeo no han d’estar al mateix domini que el lloc principal. Si les teves imatges estan en un CDN diferent, poden aparèixer al sitemap. La condició és que tots dos dominis estiguin verificats a Search Console.

Com enviar i fer el seguiment del teu sitemap a Google Search Console

La manera més directa d’enviar un sitemap a Google és a través de Search Console. El procés és senzill, però hi ha detalls que val la pena conèixer.

A Search Console, accedeix a Indexació > Sitemaps al menú lateral. Introdueix la URL del sitemap, per exemple https://elteudomain.com/sitemap.xml, i prem Enviar. Search Console mostrarà l’estat del sitemap: si s’ha processat correctament, quantes URLs ha detectat i quantes ha indexat.

L’alternativa més senzilla perquè Google trobi el sitemap sense enviament manual és declarar-lo a robots.txt:

User-agent: *
Disallow: /admin/

Sitemap: https://elteudomain.com/sitemap.xml

Aquesta línia a robots.txt garanteix que qualsevol rastrejador que respecti l’estàndard trobarà el sitemap automàticament. No substitueix l’enviament a Search Console si vols fer el seguiment de l’estat, però és una bona pràctica complementària.

Un cop enviat, Search Console mostra l’informe de sitemaps amb el nombre d’URLs enviades i descobertes. Hi ha una dada que confon moltes persones: la diferència entre “URLs enviades” i “URLs indexades”. Google pot descobrir més URLs de les que hi ha al sitemap (perquè les troba per altres mitjans) o pot indexar menys de les enviades (perquè decideix que algunes no mereixen indexar-se). Cap d’aquestes situacions és necessàriament un error.

Segons John Mueller, Search Advocate a Google, la diferència entre el nombre d’URLs al sitemap i el nombre d’URLs indexades és completament normal. Mueller ha repetit en múltiples sessions de Google Search Central que Google no indexa tot el que hi ha al sitemap, i no tot el que hi ha al sitemap mereix indexar-se. La mètrica que importa no és que la ràtio sigui 1:1, sinó que les pàgines que realment vols a l’índex hi estiguin.

Quan un sitemap no és suficient: límits i complements

El sitemap és una eina de descobriment, no una garantia d’indexació. Hi ha situacions on el sitemap és condició necessària però no suficient.

Si el teu contingut té poc PageRank o pocs enllaços externs, Google pot descobrir-lo mitjançant el sitemap però decidir no indexar-lo per baixa rellevància percebuda. El sitemap no substitueix l’enllaçat intern sòlid ni la construcció d’autoritat.

Si el teu servidor retorna errors intermitents (errors 5xx esporàdics), Google pot intentar rastrejar les URLs del sitemap i trobar errors, cosa que redueix la confiança en el lloc. Un sitemap correcte amb un servidor inestable no resol el problema d’indexació.

Si tens pàgines de baixa qualitat al sitemap, el senyal global del sitemap es degrada. Google ha indicat que la qualitat del sitemap importa: un sitemap ple de pàgines amb poc contingut o de baix valor perjudica la percepció del lloc.

El sitemap funciona millor en combinació amb un crawl budget ben optimitzat, un robots.txt correcte i una estructura d’enllaçat intern que distribueixi autoritat cap a les pàgines prioritàries. També complementa bé Google Search Console, que permet veure exactament què ha rastrejat i indexat Google i detectar discrepàncies entre el que envies i el que realment indexa.

Els sitemaps són especialment valuosos per a llocs nous amb pocs backlinks, llocs amb pàgines orfes (sense enllaços interns que hi apuntin), contingut multimèdia que Googlebot pot tenir dificultats per descobrir i llocs que publiquen contingut amb alta freqüència on la frescor importa.

Si vols verificar que el teu sitemap està ben construït abans d’enviar-lo, eines com Screaming Frog et permeten rastrejar el sitemap directament i validar que totes les URLs retornen 200, que no hi ha contradiccions amb els canònics i que l’XML és sintàcticament vàlid.

Revisa el sitemap del teu lloc aquesta setmana: descarrega l’arxiu, filtra les URLs amb resposta diferent de 200, elimina les pàgines amb noindex i verifica que el <lastmod> reflecteix canvis reals. Quatre accions concretes que milloren la qualitat del senyal que envies a Google.

Comparteix aquest article

Si t'ha resultat útil aquest contingut, comparteix-lo amb els teus col·legues.

Twitter LinkedIn

Preguntes Freqüents

¿Con qué frecuencia publican contenido nuevo?

Publicamos artículos nuevos semanalmente, enfocados en las últimas tendencias de SEO técnico, casos de estudio reales y mejores prácticas. Suscríbete a nuestro newsletter para no perderte ninguna actualización.

¿Los consejos son aplicables a cualquier tipo de sitio web?

Nuestros consejos se adaptan a diferentes tipos de sitios: ecommerce, blogs, sitios corporativos y aplicaciones web. Siempre indicamos cuándo una técnica es específica para cierto tipo de sitio o requerimientos técnicos.

¿Puedo implementar estas técnicas yo mismo?

Muchas técnicas básicas puedes implementarlas tú mismo siguiendo nuestras guías paso a paso. Para optimizaciones avanzadas o auditorías completas, recomendamos consultar con especialistas en SEO técnico como nuestro equipo.

¿Ofrecen servicios de consultoría personalizada?

Sí, ofrecemos servicios de consultoría SEO técnica personalizada, auditorías completas y optimización integral. Contáctanos para discutir las necesidades específicas de tu proyecto y cómo podemos ayudarte.

Mantén-te actualitzat

Rep al teu email els últims articles, consells i estratègies sobre SEO, rendiment web i màrqueting digital.

Enviem un butlletí cada setmana, i pots donar-te de baixa en qualsevol moment.

Tags: #sitemap xml #indexació #Google Search Console #SEO tècnic #rastreig
EG

Elu Gonzalez

Expert SEO & Optimització Web