js

Análisis de Logs: cómo ver qué hace Googlebot realmente en tu sitio

Análisis de Logs: cómo ver qué hace Googlebot realmente en tu sitio

Análisis de logs es la práctica de procesar los registros del servidor para entender qué URLs visita Googlebot, en qué frecuencia, qué status codes recibe, y dónde gasta crawl budget. Es la única forma de ver el comportamiento real de Google en tu sitio — no las estadísticas agregadas que muestra Search Console, sino la actividad URL por URL. Para sitios grandes es una de las herramientas más potentes y menos usadas.

Tipo · técnica avanzadaCategoría · TécnicoActualizado · abril 2026

Qué revelan los logs

Cada vez que Googlebot visita una URL de tu sitio, queda registro en los logs del servidor. Una entrada típica incluye: timestamp, URL, status code devuelto, user agent (Googlebot Smartphone, Googlebot Image, etc.), tamaño de respuesta, IP de origen. Procesando esa data se ve exactamente qué hace Google.

Lo que Search Console NO muestra y los logs SÍ: cuántas veces Googlebot visitó cada URL específica en el último mes, qué porcentaje de requests son a URLs canónicas vs no-canónicas, qué URLs reciben crawl excesivo (a veces 50+ visitas/mes a páginas irrelevantes), respuestas 5xx que solo le aparecen a Googlebot, y patrones de spike después de cambios técnicos.

“Search Console te da promedios. Los logs te dan la verdad URL por URL. La diferencia entre los dos es donde aparecen los hallazgos que mueven la aguja.”

Qué buscar realmente

Hallazgo 1

URLs con crawl excesivo

Páginas irrelevantes que reciben muchas visitas de Googlebot. Suelen ser parametrizadas, paginación profunda, o áreas legacy. Optimización clara de crawl budget.

Hallazgo 2

URLs ignoradas por Google

Páginas importantes que Googlebot no visita en semanas. Indica problema de internal linking o sitemap.

Hallazgo 3

Status 5xx solo para Googlebot

Errores de servidor que aparecen específicamente cuando Googlebot intenta acceder. Patrón típico: rate limiting mal configurado.

Hallazgo 4

Spike post-cambio técnico

Aumento súbito de crawl después de un release. Permite confirmar si Googlebot detectó los cambios y los está procesando.

Las herramientas que uso

Screaming Frog Log File Analyser — la opción más usada para auditorías SEO. Procesa logs estándar de Apache/nginx, da visualizaciones de crawl pattern por URL, status code, user agent. Para sitios chicos a medianos.

SEMrush Log File Analyzer — alternativa SaaS que ofrece análisis automatizado y alertas. Útil para monitoreo continuo en proyectos enterprise.

Splunk / ELK Stack — para sitios enterprise muy grandes donde los logs son masivos (TB/mes). Setup más complejo pero análisis en tiempo real.

Pandas en Python — para análisis custom cuando los SaaS no alcanzan. Patterns específicos de Googlebot, comparativos pre/post migración, análisis estadístico avanzado.

El formato típico de log

# Apache Combined Log Format 66.249.66.1 – – [29/Apr/2026:14:22:33 +0000] “GET /glosario-seo/ HTTP/1.1” 200 12345 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)” # Campos: # IP – – [timestamp] “request” status size “referrer” “user-agent”

Cuándo vale el esfuerzo

Análisis de logs es trabajo técnico que toma tiempo. Vale la pena en estos casos: sitios con 50K+ URLs donde crawl budget es restricción real (detalle en crawl budget), sitios post-migración para validar que Googlebot está visitando las URLs nuevas correctamente, sitios con problemas inexplicables de indexación donde Search Console no da pistas claras, y proyectos enterprise con auditoría técnica trimestral.

Para sitios chicos (<10K URLs) sin problemas específicos de indexación, el ROI no justifica el setup técnico. Search Console + Screaming Frog suelen alcanzar.

Cómo se aplica en la práctica

El stack típico de análisis de logs en proyectos enterprise: extracción mensual de logs (mínimo últimos 30 días), procesamiento con herramienta dedicada o pandas según escala, identificación de hallazgos accionables, plan de optimización priorizado por impacto, y validación post-implementación con logs del mes siguiente. La metodología completa está en /servicios/seo-tecnico/.