El sitemap.xml es un archivo XML que lista todas las URLs canónicas e indexables de un sitio. Es la forma estándar de comunicarle a Google qué páginas existen, cuándo cambiaron por última vez, y cuáles priorizar. No garantiza indexación pero la facilita — especialmente en sitios grandes, sitios nuevos sin autoridad, o sitios con mala arquitectura interna donde Google podría no descubrir páginas por crawling.
Para qué sirve realmente
El sitemap cumple tres funciones principales: descubrimiento (Google encuentra URLs que no llegaría por crawling tradicional), priorización (le dice a Google qué URLs son importantes vs secundarias), y monitoreo (Search Console reporta qué URLs del sitemap están indexadas vs no). Para sitios chicos no es crítico — Google descubre todo via internal linking. Para sitios con miles o millones de URLs, es indispensable.
Lo que el sitemap NO hace: garantizar indexación. Listar una URL en el sitemap no obliga a Google a indexarla. Si la URL es thin content, duplicada, o no aporta valor, Google la ignora aunque esté en el sitemap. El sitemap es sugerencia, no orden.
Las reglas que importan
Solo URLs canónicas
Cada URL del sitemap debe ser la versión canónica (no redirects, no parametrizadas, no duplicados). Si el sitemap mete URLs no-canónicas, Google empieza a desconfiar del archivo entero.
Solo URLs indexables
Sin noindex, sin bloqueadas en robots.txt, sin status 404 o 301. El sitemap es la lista de URLs que SÍ deben indexarse — incluir las otras es contradicción.
Máximo 50.000 URLs por archivo
Límite oficial de Google. Si tenés más, se divide en múltiples sitemaps + un sitemap-index.xml que los lista todos.
lastmod actualizado en serio
El campo lastmod debe reflejar la fecha real de última modificación del contenido. Si todas tus URLs muestran la misma fecha (ej: la fecha del build del sitio), Google ignora el campo.
Los tipos de sitemap
Sitemap general (sitemap.xml): el más común, lista todas las URLs HTML del sitio. Para sitios chicos puede ser uno solo. Para sitios grandes se divide en sitemaps temáticos (sitemap-products.xml, sitemap-articles.xml, etc.) referenciados desde un sitemap-index.xml.
Sitemap específicos: Google soporta sitemaps especializados para tipos de contenido específicos. Image sitemap (lista imágenes con metadata), Video sitemap (videos con duración, thumbnail, etc.), News sitemap (para sitios en Google News con publicaciones recientes). Cada uno con su propio schema.
Cómo se monitorea
La fuente de verdad es Search Console → Sitemaps. Ahí ves: cuántos sitemaps tenés enviados, fecha de último procesamiento por Google, cantidad de URLs descubiertas, errores específicos de cada uno. El cruce con Index Coverage report muestra qué porcentaje de URLs del sitemap está efectivamente indexado.
Las señales que indican problemas: porcentaje de indexación bajo (<60%), errores frecuentes en lastmod, URLs marcadas como “Discovered – currently not indexed” en volumen alto. La detección temprana evita que Google pierda confianza en el sitemap entero. Detalle en Search Console + GA4.
Cómo se aplica en la práctica
El stack típico de gestión de sitemap en proyectos enterprise: validación trimestral del sitemap con crawl completo (cada URL del sitemap debe ser status 200 + canonical + indexable), monitoreo mensual de Index Coverage en Search Console, división por tipo de contenido para sitios grandes, y submission automática vía robots.txt o ping API después de cambios masivos. La metodología completa está en /servicios/seo-tecnico/.