js

Sitemap.xml: la lista oficial de URLs que querés que Google indexe

Sitemap.xml: la lista oficial de URLs que querés que Google indexe

El sitemap.xml es un archivo XML que lista todas las URLs canónicas e indexables de un sitio. Es la forma estándar de comunicarle a Google qué páginas existen, cuándo cambiaron por última vez, y cuáles priorizar. No garantiza indexación pero la facilita — especialmente en sitios grandes, sitios nuevos sin autoridad, o sitios con mala arquitectura interna donde Google podría no descubrir páginas por crawling.

Tipo · concepto técnicoCategoría · IndexaciónActualizado · abril 2026

Para qué sirve realmente

El sitemap cumple tres funciones principales: descubrimiento (Google encuentra URLs que no llegaría por crawling tradicional), priorización (le dice a Google qué URLs son importantes vs secundarias), y monitoreo (Search Console reporta qué URLs del sitemap están indexadas vs no). Para sitios chicos no es crítico — Google descubre todo via internal linking. Para sitios con miles o millones de URLs, es indispensable.

Lo que el sitemap NO hace: garantizar indexación. Listar una URL en el sitemap no obliga a Google a indexarla. Si la URL es thin content, duplicada, o no aporta valor, Google la ignora aunque esté en el sitemap. El sitemap es sugerencia, no orden.

Estructura básica de sitemap.xml <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <loc>https://sebastianquerelos.com/glosario-seo/</loc> <lastmod>2026-04-29</lastmod> </url> </urlset>
“Un sitemap con 80% de URLs indexadas es una buena señal. Un sitemap con 30% es señal de problema. La diferencia indica qué tan bien Google entiende tu sitio.”

Las reglas que importan

Regla 1

Solo URLs canónicas

Cada URL del sitemap debe ser la versión canónica (no redirects, no parametrizadas, no duplicados). Si el sitemap mete URLs no-canónicas, Google empieza a desconfiar del archivo entero.

Regla 2

Solo URLs indexables

Sin noindex, sin bloqueadas en robots.txt, sin status 404 o 301. El sitemap es la lista de URLs que SÍ deben indexarse — incluir las otras es contradicción.

Regla 3

Máximo 50.000 URLs por archivo

Límite oficial de Google. Si tenés más, se divide en múltiples sitemaps + un sitemap-index.xml que los lista todos.

Regla 4

lastmod actualizado en serio

El campo lastmod debe reflejar la fecha real de última modificación del contenido. Si todas tus URLs muestran la misma fecha (ej: la fecha del build del sitio), Google ignora el campo.

Los tipos de sitemap

Sitemap general (sitemap.xml): el más común, lista todas las URLs HTML del sitio. Para sitios chicos puede ser uno solo. Para sitios grandes se divide en sitemaps temáticos (sitemap-products.xml, sitemap-articles.xml, etc.) referenciados desde un sitemap-index.xml.

Sitemap específicos: Google soporta sitemaps especializados para tipos de contenido específicos. Image sitemap (lista imágenes con metadata), Video sitemap (videos con duración, thumbnail, etc.), News sitemap (para sitios en Google News con publicaciones recientes). Cada uno con su propio schema.

Cómo se monitorea

La fuente de verdad es Search Console → Sitemaps. Ahí ves: cuántos sitemaps tenés enviados, fecha de último procesamiento por Google, cantidad de URLs descubiertas, errores específicos de cada uno. El cruce con Index Coverage report muestra qué porcentaje de URLs del sitemap está efectivamente indexado.

Las señales que indican problemas: porcentaje de indexación bajo (<60%), errores frecuentes en lastmod, URLs marcadas como “Discovered – currently not indexed” en volumen alto. La detección temprana evita que Google pierda confianza en el sitemap entero. Detalle en Search Console + GA4.

Cómo se aplica en la práctica

El stack típico de gestión de sitemap en proyectos enterprise: validación trimestral del sitemap con crawl completo (cada URL del sitemap debe ser status 200 + canonical + indexable), monitoreo mensual de Index Coverage en Search Console, división por tipo de contenido para sitios grandes, y submission automática vía robots.txt o ping API después de cambios masivos. La metodología completa está en /servicios/seo-tecnico/.