Hay un malentendido persistente sobre los sitemaps: mucha gente los crea una vez, los sube a Search Console y da por hecho que Google indexará todo. La realidad es más matizada. Google trata el sitemap como una sugerencia, no como una orden. Y hay condiciones concretas bajo las cuales lo ignora por completo.
El sitemap XML es el mapa que le entregas a Googlebot al llegar a tu sitio. Si el mapa está bien dibujado, incluye las rutas correctas y señala los destinos más importantes, Googlebot puede hacer su trabajo con eficiencia. Si el mapa tiene errores, incluye calles cortadas o apunta a lugares que no existen, Googlebot lo descarta y busca su propio camino, que puede o no llevarle a lo que más te importa.
Esta guía cubre lo que realmente necesitas saber: tipos de sitemap, qué campos lee Google y cuáles ignora, cómo funcionan los sitemaps para multimedia, cómo generarlos en las plataformas más comunes y cómo enviarlos y monitorizar su estado en Google Search Console.
Tipos de sitemap XML: cuál necesita tu sitio
No existe un único tipo de sitemap. El protocolo estándar de sitemaps.org, adoptado por Google, Bing y Yahoo en 2006, define el formato base, y Google ha desarrollado extensiones para tipos de contenido específicos.
El sitemap XML estándar lista URLs de páginas web con metadatos opcionales. Es el tipo más común y el punto de partida para cualquier sitio. Si tienes un blog, una web corporativa o un ecommerce sin contenido multimedia especializado, este es el único que necesitas.
Los sitemaps de imágenes permiten a Google descubrir imágenes que el rastreo ordinario podría no encontrar, especialmente las que se cargan mediante JavaScript. No reemplazan al sitemap principal: se añaden como extensión dentro del mismo archivo o en un archivo separado. Cada URL puede incluir hasta 1.000 referencias de imagen.
Los sitemaps de vídeo funcionan de manera similar pero para contenido audiovisual. Incluyen campos específicos como duración (en segundos, entre 1 y 28.800), fecha de publicación, calificación y restricciones geográficas. Son especialmente importantes si quieres que tus vídeos aparezcan en Google Vídeos.
Los sitemaps de noticias son para publicaciones de Google News. Tienen una restricción temporal importante: solo deben contener artículos publicados en los últimos dos días. Superada esa ventana, los artículos deben eliminarse del sitemap de noticias aunque sigan en el sitio. El límite es de 1.000 URLs por archivo, mucho más bajo que el estándar.
¿Cuál necesitas? La respuesta depende de tu contenido. Un blog estándar o web corporativa: sitemap XML estándar. Un sitio con fotografías o galerías de imágenes: sitemap de imágenes. Un canal de vídeo o curso online: sitemap de vídeo. Un medio de comunicación: sitemap de noticias además del estándar.
Estructura técnica de un sitemap XML: los campos que Google lee y los que ignora
El protocolo sitemaps.org define cuatro campos posibles dentro de cada entrada <url>. Conocer cuáles usa Google y cuáles descarta ahorra tiempo y evita confusiones.
<loc> es el único campo obligatorio. Debe contener la URL completa, incluyendo protocolo, dominio y trailing slash si tu servidor lo requiere. La URL no puede superar 2.048 caracteres. Todos los caracteres especiales (ampersands, comillas, corchetes angulares) deben escaparse con entidades XML.
<lastmod> es el único campo opcional que Google usa, y con condiciones. Si la fecha que proporcionas refleja genuinamente cuándo cambió el contenido de la página, Google la usa para priorizar el rastreo de páginas actualizadas. Si la fecha es incorrecta, siempre la misma o generada automáticamente sin cambios reales, Google deja de fiarse del campo para tu sitio. La precisión importa más que la presencia.
<changefreq> y <priority> son campos que Google ignora explícitamente. La documentación oficial lo confirma sin ambigüedades. Que los incluyas o no en tu sitemap no cambia nada desde el punto de vista de Google. Algunos generadores los incluyen por compatibilidad con otros motores de búsqueda o por inercia histórica, pero para el rastreo de Google no tienen efecto.
Un sitemap XML válido y mínimo tiene esta estructura:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://ejemplo.com/pagina/</loc>
<lastmod>2026-03-15</lastmod>
</url>
<url>
<loc>https://ejemplo.com/otra-pagina/</loc>
<lastmod>2026-04-01</lastmod>
</url>
</urlset>
Para sitios con más de 50.000 URLs o archivos que superan 50MB sin comprimir, se necesita un sitemap index. Este archivo actúa como índice que referencia múltiples archivos de sitemap individuales:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://ejemplo.com/sitemap-blog.xml</loc>
<lastmod>2026-04-01</lastmod>
</sitemap>
<sitemap>
<loc>https://ejemplo.com/sitemap-productos.xml</loc>
<lastmod>2026-04-01</lastmod>
</sitemap>
</sitemapindex>
Un sitemap index puede referenciar hasta 50.000 sitemaps individuales. Si tienes un ecommerce con millones de productos, puedes distribuirlos en múltiples archivos que el index referencia.
Errores que hacen que Google ignore tu sitemap
Gary Illyes, analista de tendencias en Google, fue directo en un episodio del podcast Search Off the Record: los sitemaps con demasiadas URLs de error o con fechas de lastmod incorrectas acaban siendo ignorados por Google, que aprende a desconfiar de la señal. No lo dijo exactamente así, pero la implicación de años de documentación y declaraciones de Google Search Central es clara: un sitemap fiable tiene más valor que un sitemap completo.
Los errores más habituales que degradan la utilidad del sitemap son concretos y evitables.
Incluir URLs que devuelven 3xx o 4xx es el error más frecuente. Si una URL de tu sitemap responde con 301, 302 o 404, Google gasta recursos en una visita que no termina en contenido indexable. Cada auditoría técnica que corremos con Screaming Frog en sitios con problemas de indexación muestra este patrón: entre el 5% y el 30% de las URLs del sitemap apuntan a páginas redirigidas o eliminadas. El sitemap debe incluir exclusivamente URLs con respuesta 200.
Incluir páginas con noindex es otro error común. Si una página tiene la directiva noindex en el HTML, incluirla en el sitemap envía señales contradictorias: el sitemap dice “indexa esto” y el HTML dice “no lo indexes”. Google suele respetar el noindex, pero la contradicción consume rastreo inútilmente.
Fechas de <lastmod> estáticas o incorrectas. Algunos generadores de sitemaps ponen la fecha de generación del sitemap como lastmod de todas las URLs, aunque las páginas no hayan cambiado. Google detecta este patrón y deja de usar el campo lastmod de ese dominio como señal de frescura.
URLs de contenido duplicado o páginas canónicas no principales. Si tienes versiones /es/ y /en/ del mismo contenido, el sitemap debe incluir solo las URLs canónicas de cada versión, no todas las variantes. Del mismo modo, las páginas con parámetros de URL que son variantes de una página principal deben excluirse si no son las canónicas.
Sitemaps nunca actualizados. Un sitemap que no cambia en meses, aunque el sitio sí cambie, pierde relevancia. Google reduce la frecuencia con la que lo consulta porque aprende que no aporta información nueva.
Sitemaps para diferentes plataformas: Astro, WordPress, Next.js
La generación del sitemap varía según la plataforma. Conocer cómo funciona cada una evita configuraciones manuales innecesarias y errores de implementación.
En WordPress, los plugins Yoast SEO y RankMath generan sitemaps automáticamente y los mantienen actualizados. Yoast genera un sitemap index en /sitemap_index.xml que divide el contenido por tipo (posts, páginas, categorías, autores). RankMath hace algo similar en /sitemap.xml. Ambos excluyen automáticamente páginas con noindex y permiten configurar qué tipos de contenido aparecen. El problema más frecuente en WordPress es incluir páginas de autor o de archivo de tags que tienen poco contenido único; conviene revisar qué tipos incluye el plugin y desactivar los que no aporten valor.
En Astro, la integración oficial @astrojs/sitemap genera el sitemap automáticamente durante el build. Se configura en astro.config.mjs con opciones para filtrar URLs, personalizar el lastmod y dividir en múltiples archivos para sitios grandes. Para sitios estáticos con output: “static”, el sitemap se genera en el proceso de build y se publica con el resto del sitio. Si necesitas sitemaps de imágenes o hreflang para sitios multilingüe, la configuración requiere pasar las opciones correspondientes a la integración.
En Next.js, la biblioteca next-sitemap es la más usada para generar sitemaps post-build. Se configura con un archivo next-sitemap.config.js que controla qué rutas incluir, qué excluir, y si generar sitemaps separados por sección. Next.js 13+ con App Router tiene soporte nativo para sitemaps mediante el archivo sitemap.ts en el directorio app/, que exporta una función que retorna el array de URLs.
En sitios estáticos sin framework o con generadores como Hugo o Eleventy, el sitemap debe generarse como parte del proceso de build o mantenerse manualmente. La opción manual solo es viable para sitios con menos de 100 URLs que raramente cambian.
Sitemaps de imágenes y vídeos: indexación de contenido multimedia
Los sitemaps multimedia merecen atención específica porque tienen un impacto desproporcionado en la visibilidad de ciertos tipos de contenido.
El sitemap de imágenes es especialmente útil para fotografías de producto, galerías, portafolios y cualquier imagen cargada con JavaScript o lazy loading agresivo. Googlebot puede tener dificultades para descubrir imágenes que solo se cargan después de interacciones del usuario o que están en componentes renderizados en el cliente. El sitemap de imágenes resuelve este problema directamente.
La estructura de una extensión de imagen dentro del sitemap estándar es:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
<url>
<loc>https://ejemplo.com/producto/camisa-azul/</loc>
<image:image>
<image:loc>https://ejemplo.com/imagenes/camisa-azul-frontal.jpg</image:loc>
</image:image>
<image:image>
<image:loc>https://ejemplo.com/imagenes/camisa-azul-detalle.jpg</image:loc>
</image:image>
</url>
</urlset>
Los campos <image:caption>, <image:title>, <image:geo_location> y <image:license> han sido eliminados de la especificación oficial de Google. Solo <image:loc> es necesario.
Para el sitemap de vídeo, los campos obligatorios son thumbnail, título, descripción y al menos una de las dos ubicaciones del contenido (el archivo de vídeo o la URL del player). Los campos opcionales como duración y fecha de publicación mejoran cómo Google muestra el resultado en los resultados de vídeo.
Un punto que suele ignorarse: las URLs del sitemap de imágenes y vídeo no necesitan estar en el mismo dominio que el sitio principal. Si tus imágenes están en un CDN diferente, pueden aparecer en el sitemap. La condición es que ambos dominios estén verificados en Search Console.
Cómo enviar y monitorizar tu sitemap en Google Search Console
La forma más directa de enviar un sitemap a Google es a través de Search Console. El proceso es sencillo, pero hay detalles que conviene conocer.
En Search Console, accede a Indexación > Sitemaps en el menú lateral. Introduce la URL del sitemap, por ejemplo https://tudominio.com/sitemap.xml, y pulsa Enviar. Search Console mostrará el estado del sitemap: si se ha procesado correctamente, cuántas URLs ha detectado y cuántas ha indexado.
La alternativa más simple para que Google encuentre el sitemap sin enviarlo manualmente es declararlo en robots.txt:
User-agent: *
Disallow: /admin/
Sitemap: https://tudominio.com/sitemap.xml
Esta línea en robots.txt garantiza que cualquier crawler que respete el estándar encontrará el sitemap automáticamente. No sustituye al envío en Search Console si quieres monitorizar el estado, pero es una buena práctica complementaria.
Una vez enviado, Search Console muestra el informe de sitemaps con el número de URLs enviadas y descubiertas. Hay un dato que confunde a muchos: la diferencia entre “URLs enviadas” y “URLs indexadas”. Google puede descubrir más URLs de las que hay en el sitemap (porque las encuentra por otros medios) o puede indexar menos de las enviadas (porque decide que algunas no merecen indexarse). Ninguna de estas situaciones es necesariamente un error.
Las advertencias y errores que muestra Search Console en el informe de sitemaps son útiles como punto de partida para una auditoría. Los más frecuentes son URLs no indexadas, errores de rastreo y páginas bloqueadas por robots.txt.
Según John Mueller, Search Advocate en Google, la diferencia entre el número de URLs en el sitemap y el número de URLs indexadas es completamente normal. “Google no indexa todo lo que hay en el sitemap, y no todo lo que está en el sitemap merece indexarse” es una paráfrasis de lo que Mueller ha repetido en múltiples sesiones de Google Search Central. La métrica que importa no es que el ratio sea 1:1, sino que las páginas que realmente quieres en el índice estén indexadas.
Cuándo un sitemap no es suficiente: límites y complementos
El sitemap es una herramienta de descubrimiento, no de indexación garantizada. Hay situaciones donde el sitemap es condición necesaria pero no suficiente.
Si tu contenido tiene poco pagerank o pocos enlaces externos, Google puede descubrirlo mediante el sitemap pero decidir no indexarlo por baja relevancia percibida. El sitemap no sustituye al enlazado interno sólido ni a la construcción de autoridad.
Si tu servidor devuelve errores intermitentes (5xx esporádicos), Google puede intentar rastrear las URLs del sitemap y encontrar errores, lo que reduce la confianza en el sitio. El sitemap correcto con un servidor inestable no resuelve el problema de indexación.
Si tienes páginas de baja calidad en el sitemap, la señal global del sitemap se degrada. Google ha mencionado que la calidad del sitemap importa: un sitemap lleno de páginas thin o de bajo valor perjudica la percepción del sitio.
El sitemap trabaja mejor en combinación con un crawl budget bien optimizado, un robots.txt correcto y una estructura de enlazado interno que distribuya autoridad hacia las páginas prioritarias. También complementa bien el perfil de Google Search Console, que permite ver exactamente qué ha rastreado e indexado Google y detectar discrepancias entre lo que envías y lo que realmente indexa.
Dicho esto, los sitemaps son especialmente valiosos para sitios nuevos con pocos backlinks, sitios con páginas huérfanas (sin enlaces internos que apunten a ellas), contenido multimedia que Googlebot puede tener dificultades para descubrir y sitios que publican contenido con frecuencia alta donde la frescura importa.
Si quieres verificar que tu sitemap está bien construido antes de enviarlo, herramientas como Screaming Frog permiten rastrear el sitemap directamente y validar que todas las URLs responden 200, que no hay contradicciones con los canonicals y que el XML es sintácticamente válido.
Revisa el sitemap de tu sitio esta semana: descarga el archivo, filtra las URLs con respuesta distinta de 200, elimina las páginas con noindex y verifica que el <lastmod> refleja cambios reales. Son cuatro acciones concretas que mejoran la calidad de la señal que envías a Google.
Comparte este artículo
Si te ha resultado útil este contenido, compártelo con tus colegas.
Preguntas Frecuentes
¿Con qué frecuencia publican contenido nuevo?
Publicamos artículos nuevos semanalmente, enfocados en las últimas tendencias de SEO técnico, casos de estudio reales y mejores prácticas. Suscríbete a nuestro newsletter para no perderte ninguna actualización.
¿Los consejos son aplicables a cualquier tipo de sitio web?
Nuestros consejos se adaptan a diferentes tipos de sitios: ecommerce, blogs, sitios corporativos y aplicaciones web. Siempre indicamos cuándo una técnica es específica para cierto tipo de sitio o requerimientos técnicos.
¿Puedo implementar estas técnicas yo mismo?
Muchas técnicas básicas puedes implementarlas tú mismo siguiendo nuestras guías paso a paso. Para optimizaciones avanzadas o auditorías completas, recomendamos consultar con especialistas en SEO técnico como nuestro equipo.
¿Ofrecen servicios de consultoría personalizada?
Sí, ofrecemos servicios de consultoría SEO técnica personalizada, auditorías completas y optimización integral. Contáctanos para discutir las necesidades específicas de tu proyecto y cómo podemos ayudarte.