
La mayoría de los sitios web publicados hoy en día tienen un archivo sitemap XML sin que su propietario sea consciente de ello. Desde WordPress 5.5, se genera automáticamente un sitemap nativo en la dirección /wp-sitemap.xml. Plataformas como Framer o Shopify hacen lo mismo al publicar. Esta generación silenciosa plantea un problema concreto: existe un archivo sitemap, pero nadie verifica su contenido ni lo que informa a los robots de exploración de los motores de búsqueda.
Sitemap XML generado automáticamente: lo que los CMS incluyen sin avisar
WordPress, en su configuración por defecto, integra en el sitemap elementos que el propietario del sitio nunca tuvo la intención de indexar. Páginas de prueba que permanecen en línea, tipos de publicaciones personalizadas no utilizadas, taxonomías técnicas creadas por extensiones: todo se encuentra listado en el archivo XML enviado a Google.
También recomendado : Consejos imprescindibles para mejorar la experiencia del usuario en su sitio web
El resultado es un mapa del sitio que no refleja la estructura real del sitio web. Los robots de indexación reciben un mapa distorsionado, donde URL sin valor coexisten con las páginas que realmente se desean posicionar. WPFormation recomienda en su guía 2026 desactivar o filtrar ciertos contenidos a través de un plugin o código para que el sitemap sirva para la navegación y el SEO, no al revés.
El mismo fenómeno afecta a otros creadores de sitios. Shopify genera un sitemap estructurado por colecciones, productos y páginas, pero los comerciantes que crean páginas temporales (promociones, pruebas A/B) las ven persistir en el archivo sin intervención manual. En Adobe Experience Manager, la configuración de los sitemaps pasa por componentes específicos cuyo ajuste por defecto no excluye las páginas de administración internas.
Lectura complementaria : Guía práctica para crear una firma electrónica fiable y segura fácilmente
Consultar la página sitemap de BestWeb permite visualizar cómo se ve un sitemap estructurado y filtrado, donde solo aparecen las URL relevantes.

Degradación silenciosa del sitemap: un riesgo subestimado para el SEO
Un sitemap válido en el momento de su creación puede volverse problemático en pocas semanas. URL eliminadas o redirigidas siguen listadas en el archivo XML. El sitemap entonces devuelve páginas con error 404 a los robots de Google, lo que diluye el presupuesto de rastreo y retrasa la indexación de los contenidos recientes.
Este tipo de degradación a menudo pasa desapercibido porque no se activa ninguna alerta. El propietario del sitio solo nota la disminución de la indexación y del tráfico varias semanas después de que aparezca el problema. Servicios como Oh Dear se han especializado en la supervisión de sitemaps para detectar estas anomalías:
- Archivo sitemap que se ha vuelto inválido o que devuelve un error de servidor
- URL listadas que devuelven un código 404 o una redirección en bucle
- Modificación no intencionada del número de URL referenciadas (adición o eliminación masiva)
Un sitemap no supervisado puede perjudicar más que un sitio sin sitemap. Los motores de búsqueda son capaces de descubrir páginas a través del enlazado interno y los enlaces externos. En cambio, un archivo XML que apunta a callejones sin salida envía una señal de mala mantenimiento técnica.
Sitemap HTML y sitemap XML: dos archivos, dos funciones distintas
La confusión entre sitemap XML y sitemap HTML sigue siendo frecuente. El archivo XML se dirige a los robots de exploración. Lista las URL con metadatos técnicos (fecha de última modificación, frecuencia de actualización). El sitemap HTML es una página del sitio destinada a los visitantes humanos, que presenta la estructura en forma de enlaces clicables.
Un sitemap HTML bien diseñado mejora la navegación en sitios con una estructura profunda, donde algunas páginas se encuentran a más de tres clics de la página de inicio. Para sitios pequeños con un menú claro, su utilidad sigue siendo marginal.
Cuando el sitemap HTML aporta un verdadero valor
Los sitios de comercio electrónico con varios cientos de categorías y subcategorías se benefician de un sitemap HTML. Los portales de información cuya archivo abarca varios años de publicación también. En estos casos, el sitemap HTML sirve como una red de seguridad para las páginas huérfanas, aquellas que ningún enlace interno conecta directamente a la estructura principal.
Para el SEO, Google ha indicado que el archivo XML sigue siendo el formato preferido para comunicar la lista de páginas a explorar. El sitemap HTML no tiene un efecto directo sobre la indexación, pero distribuye jugo de enlace interno hacia las páginas profundas.

Enviar y mantener un sitemap en Google Search Console
Crear un archivo sitemap no es suficiente. Su envío a través de Google Search Console permite verificar que Google lo lee correctamente e identificar errores de procesamiento. El informe de cobertura muestra el número de URL enviadas, el número indexado y las URL excluidas con su motivo.
El mantenimiento del sitemap implica algunas verificaciones regulares:
- Comparar el número de URL en el sitemap con el número de páginas realmente indexadas en la Search Console
- Asegurarse de que las URL que devuelven un código 404 o 301 sean retiradas del archivo
- Verificar que las nuevas páginas publicadas aparezcan en el sitemap en un plazo de 24 a 48 horas
- Controlar que el archivo no supere el límite de 50,000 URL por sitemap (más allá, se necesita un índice de sitemaps)
El parámetro lastmod debe reflejar la fecha de modificación real de la página, no la fecha de regeneración del archivo. Google ha precisado que ignora los valores lastmod cuando no corresponden a un cambio de contenido efectivo, lo que hace que este campo sea inútil si el CMS lo actualiza en cada reconstrucción del sitemap.
Segmentar el sitemap para sitios voluminosos
Algunos SEO dividen sus archivos sitemap por tipo de contenido (artículos, categorías, productos, páginas estáticas). Esta segmentación facilita el diagnóstico: si la indexación de las páginas de productos cae, el sitemap dedicado permite aislar el problema sin revisar todo el archivo.
Un sitemap bien estructurado no es un archivo que se crea una vez para olvidarse. Es una herramienta de diagnóstico permanente, cuyo valor depende completamente de su mantenimiento. El mejor sitemap es aquel que solo contiene las URL que se desea ver indexadas, nada más.