Sitemap. ¿Qué es? Usos avanzados que quizá no conocías!
Hoy estamos hablando de un archivo popular por todos, el Sitemap. Un archivo que la mayoría de proyectos en Internet están utilizando y escasos los utilizan de manera precisa.
Ya tenía ganas de comentar de esto y llegó el instante, puesto que este archivo la mayoría de ocasiones pasa inadvertido y se crea automáticamente con un plugin o modulo y no se regresa a tocar jamás. Y la realidad que tiene bastantes usos que durante este artículo te quiero contar.
En este artículo quiero mostrar algunas puntos que estamos en nuestro día a día con los Sitemaps y las resoluciones por las que elegimos en relación del emprendimiento, volumen y estado del mismo.
¿Qué es el Sitemap?
El Sitemap es un archivo que se utiliza para señalarle a algún motor de búsqueda (en esta situación a Google) las URLs de un emprendimiento Web, para que los robots rastreen de manera más eficaz dicho emprendimiento. Además el sitemap también te afirma que los robots recogerán esa información antes, la utilización que hagan de la misma ya es dependiente de otros componentes que contaré durante este artículo.
Formatos en los que tenemos la posibilidad de crear un Sitemap:
- XML: Este es el más utilizado y el que te sugiero utilizar. La mayoría de plugins, modulos y extensiones que utilizan los administradores de contenidos como WordPress, Prestashop o magento utilizan este formato.
- RSS: Si tienes un feed generado que automatiza la subida otra vez contenido, puedes incluirlo como sitemap, pero ojo con esto porque la mayoría de feeds se olvidan de muchas páginas antiguas que no se han generado de forma automática.
- Documento de Texto: También puedes integrar ficheros .txt para la generación de tu Sitemap. Eso sí, tienes que integrar una dirección de Internet por linea.
- Google Sites: Otra forma de hacer tu Sitemap que No te sugiero, pero que Google facilita su uso, aquí te dejo toda la info: https://support.Google.com/webmasters/answer/183668?hl=es&ref_topic=4581190#sitemapformat
Cabe resaltar que también puedes hacer sitemaps para imágenes, vídeos o móviles, pero esto es algo que cada día veo más establecido en los proyectos que me acercamiento.
IMPORTANTE: Hasta aquí solo dimos una ojeada sobre que es un sitemap y que formatos puedes utilizar. Nada que no consigas hallar en las directivas de Google como siempre comento (ahí esta todo, y no en otros sitios 😉 ). Si no conocías todos sus usos, he dejado numerosos links a la documentación oficial de Google. Ahhhh! Ten en cuenta que no puedes crear Sitemaps de más de 50.000 URLs, aunque yo te sugiero que no pases de 40.000 por mi vivencia. Cuando tienes muchas una cantidad enorme de URLs conviene que realices un indice de Sitemaps.
Algo que tienes que tomar en cuenta que en la mayoría de casos no se tiene son los próximos aspectos:
- No integrar en el Sitemap URLs con Noindex
- No integrar en el Sitemap URLs que no respondan un código 200
- No integrar en el Sitemap URLs NO canonicas
ESTAS SON LAS 3 RELAS DE ORO DEL SITEMAP 😉
IMPORTANTE: El sitemap no se utiliza para indexar URLs, cierto es que la generación de Sitemaps de manera correcta asisten al rastreo, pero no se usa para indexar, y bastante menos este es un archivo obligación. Algún web pequeña-mediana no requiere un sitemap para que Google indexe sus URLs, sencillamente con un óptimo enlazado de adentro bastaría.
Aquí te dejo un caso de éxito, para que emplies información y mires como un óptimo uso de los Sitemaps se usa para hacer mejor el rastreo, la indexación y subir el tráfico: https://moz.com/blog/multiple-xml-sitemaps-increased-indexation-and-traffic
Errores en el momento de crear Sitemaps
Durante los últimos años auditando webs y haciendo un trabajo con diferentes proyectos me encontré de todo con el tema de los Sitemaps, pero lo que más luce por encima de algún cosa es lo siguiente:
- Incluir URLs que argumentan códigos 301.
- Incluir URLs que argumentan 404.
- Incluir URLs que tienen el canonical apuntando hacía otra dirección de Internet.
- Incluir URLs bloqueadas por el Robots.txt (esta es la preferible xD).
Para corroborar que en un emprendimiento no te está pasando nada de esto es muy simple, solo necesitas el Sitemap del emprendimiento y Screaming Frog (Por si aún no estás puesto con esta utilidad, aquí te dejo una completa guía de Screaming Frog). Te explico el desarrollo en numerosos pasos:
PASO 1: Descarga el archivo Sitemap para lograr trabajar con el archivo.
PASO 2: Inicia Screaming Frog >> Mode>> List >> Upload List >> from a file >> selecciona Sitemap xml. Con esto conseguirás subir tu Sitemap para analizarlo en hondura y sacar los fallos que logre crear.
PASO 3: Identifica los fallos y crea un Sitemap preciso. Con esto conseguiras una optimización de rastreo considerable. En relación del estado de tu Sitemap esta optimización de rastreo puede lograr que tu emprendimiento comience a hacer mejor posiciones.
¿Cuando tienes que hacer esta comprobación?
Generalmente voy a enumerar algunas ocasiones donde esta comprobación es importantísima, así como la generación de un nuevo sitemap que lleve a cabo que el robot de Google pase de forma más capaz por tu Site:
- Si has establecido el popular HTTPS en tu página, entonces es un instante fundamental para corroborar tu Sitemap y verás la proporción de 3xx que te vas a hallar.
- Si has llevado a cabo una migración o cambios en URLs hace poco. Te encontrarás con sorpresas tipo: 301 y 404 xD.
- Si disfrutas bastante jugar con los Noindex o estas utilizando un plugin para crear tu Sitemap, indudablemente te encuentres URLs con noindex que estás introduciendo en el Sitemap.
- Si disfrutas bastante la utilización de los “canonical” indudablemente te encuentres sorpresas repugnantes en tu Sitemap.
2 Usos avanzados del Sitemap
El sitemap tiene diferentes usos. Aquí te voy a argumentar en que ocasiones los uso y el porque de todas estas acciones que realizo:
1. Apresurar la desindexación de un enorme número de URLs debido al Sitemap
¡Empezamos con el primer ámbito común! Poseemos una proporción de URLs innecesarias que deseamos desindexar por el fundamento que sea (no quiero ingresar en datos sino esto sería eterno, en siguientes posts abordaremos el porque requerimos frecuentemente desindexar URLs). Imaginate que son cientos o miles. No puedes aguardar a que Google pase por todos y cada uno según su continuidad de rastreo.
- Para apresurar este desarrollo de desindexación de una cantidad enorme de URLs, sencillamente debemos crear un Sitemap introduciendo todas las URLs que tengamos ya con noindex y subirlas a Search Console. Para eso he pedido a mi compañero Julio que suba una utilidad para crear Sitemaps de manera libre y gratuita que puedes hallar aquí, puesto que Screaming Frog y otras utilidades dan inconvenientes con esta clase de URLs.
- Una vez pasado un tiempo destacable sencillamente cogemos todas esas URLs y comprobamos que se han desindexado utilizando dirección de Internet Profiler (esta utilidad la explicaré más adelante). Sencillamente insertas todas las URLs y eliges la opción de “Google Indexation”.
- Una vez que estén desindexadas eliminamos el Sitemap de Search Console.
Aquí te dejo una sucesión de Publicaciones de Twitter donde hace aparición Gary Illyes opinando al respecto:
@nishanthstephen generally anything you put in a sitemap will be picked up sooner
— Gary Illyes (@methode) 13 de octubre de 2015
2. Hacer un Sitemap para remover URLs más rápidamente
¡Este ámbito hace aparición en muchísimos ecommerce! Piensa que tienes un ecommerce y trabajas con temporadas de productos y de golpe tienes que remover diferentes categorías y productos por diferentes fundamentos. Ojo cuando pasa esto hay numerosas opciones:
- Comprobar que ninguna dirección de Internet tiene links externos que estén dando autoridad.
- Comprobar el tráfico orgánico de esas URLs, puesto que si tengo algunas URLs con tráfico en ningún caso las eliminaría.
- Comprobar que no hay productos semejantes, puesto que si los hubiera y tuvieramos tráfico a esas URLs podríamos realizar un 301.
OJO: Algo muy común dentro de los shoppings electrónicos son las redirecciones a otras partes de la web, en los puntos anteriores ya he comentado lo que hay que corroborar antes de tomar elecciones. El inconveniente de llevar a cabo redirecciones sin sentido común y sin investigar es que se van a crear códigos 404 Soft y como sigas con esa práctica tu Search Console se innundará de ellos.
- Si ya tienes decidido que tienes que remover estas URLs porque no tienen tráfico ni links externos que aporten autoridad, y además esas URLs por el momento no van a volver a existir. Sencillamente tienes que lograr que esas URLs devuelvan un código 410.
- Realizar un Sitemap con todas las URLs que argumentan 410. Ten en cuenta que puedes crearlo con esta utilidad gratis.
- Una vez pasado un tiempo destacable sencillamente cogemos todas esas URLs y comprobamos que se han desindexado utilizando dirección de Internet Profiler. Sencillamente insertas todas las URLs y eliges la opción de “Google Indexation”.
- Una vez que estén desindexadas eliminamos el Sitemap de Search Console.
Opiniones e Impresiones sobre los Sitemaps – [VÍDEO]
El archivo Sitemap – Mis conclusiones
Como has podido corroborar en todo el artículo, el Sitemap tiene múltiples usos y se le puede sacar bastante partido. A día de hoy estoy convencido de que no se le saca todo el partido que se le podría sacar y por esto he amado exhibir para que lo uso adjuntado con mis compañeros en mi día a día.
Si revisas el Sitemap cada cierto tiempo, le prestas atención y usas los puntos avanzados que te he exhibido, indudablemente sea para ti una utilidad muy productiva y, en según que casos, te ayudará a hacer mejor el rastreo de tu página.
En este momento me gustaría entender los usos que tu le das al Sitemap y así poder sacar más ideas para lograr utilizar este archivo de manera más eficaz y sacarle más partido. ¿Te animas a comentar tus usos e impresiones?