¿Qué son las páginas huérfanas?
Las páginas huérfanas son páginas del sitio web que no están enlazadas desde ninguna otra sección de tu sitio. Esto significa que un usuario no sabe a dónde ir después para obtener más información porque tu página no está vinculada a otras secciones de tu sitio. Las páginas huérfanas no reciben autoridad o relevancia de otras, ya que no les llegan enlaces internos.
¿Cómo podemos detectar las páginas huérfanas en nuestro site?
Aquí te voy a dar una serie de consejos para poder localizar este tipo de páginas, porque como veremos un poco más adelante las páginas huérfanas no son buenas para el posicionamiento seo de tu web.
Para detectar esas páginas huérfanas tan poco beneficiosas para el seo de nuestra web podemos llevar a cabo estas acciones:
- Obteniendo un listado del Sitmemap XML. En este listado extraeremos todas las urls de las distintas entradas que hemos creado en nuestro gestor de contenidos o CMS
- Mediante Search Console obtener un listado de páginas que están generando impresiones, pero no hay clics o tráfico orgánico hacia ellas. Desde Search Console nos podremos descargar estas URLs
- Empieza a recibir reseñas y comentarios sobre tu negocio
- Mediante Ahrefs podemos exportar en un archivo todas aquellas urls que tienen enlaces externos entrantes. Esto mismo también lo podemos hacer desde Search Console, pero yo prefiero hacerlo desde Ahrefs.
- Con GA (Google Analytics) obtendremos todas aquellas urls que tienen tráfico, ya sea orgánico o de cualquier otro tipo.
- Y por último, de los Logs de nuestro servidor de los que podremos obtener un listado de todas las URLs HTML
De este modo obtendremos todas las URLs y sobre todo aquellas que reciben tráfico. A continuación, unimos todas las URLs en una lista y la comparamos con las URLs obtenidas en un rastro completo del site, obtendremos de este modo las páginas huérfanas.
Otro método mucho más sencillo es la utilización de un crawler como Screaming Frog. Para ello realiza un crawleo y una vez realizado te vas a la pestaña Internal. En esta pestaña la herramienta seo te va a mostrar el número total de enlaces internos entrantes que va a tener una URL determinada. Si observas que tiene 0 enlaces internos, esa es una página huérfana.
¿Las páginas huérfanas son un problema para el SEO de mi web?
Este tipo de páginas van a causar dos problemas principales en el SEO de tu web:
- Baja clasificación y tráfico: Aunque tengan un gran contenido, las páginas huérfanas normalmente no se posicionan bien en las SERPs ni reciben mucho tráfico de búsqueda orgánica.
- Desperdicio de rastreo: Las páginas huérfanas de poco valor (por ejemplo, las páginas duplicadas) pueden estar robando presupuesto de rastreo a sus páginas importantes. Cuando las páginas huérfanas constituyen una parte considerable de las páginas que Google explora en tu sitio web puedes hacerte una idea de la magnitud del problema.
¿Por qué aparecen páginas huérfanas en nuestra página web?
Aquí os quiero mostrar distintos escenarios por los que pueden aparecer las páginas huérfanas y cómo solucionarlo:
1. Las páginas caducadas siguen devolviendo contenido: Algunos sitios web simplemente dejan de enlazar a contenidos caducados (como productos retirados del catálogo) y no devuelven un código de estado (como HTTP 404 o 410) para indicar que el contenido ya no existe. Como resultado, la página antigua sigue estando disponible.
Cómo solucionarlo: Además de eliminar los enlaces al contenido caducado, debes asegurarte de actualizar la página caducada con el código de estado adecuado. Si el contenido ya no está disponible, asegúrese de que el código sea 404 o 410.
2. Páginas que quedaron fuera de una migración anterior del sitio: Se trata de páginas que no se redirigen y, por tanto, el contenido antiguo podría seguir estando disponible.
Cómo solucionarlo: Si hay contenido similar en su nuevo sitio web, debería redirigir estas antiguas URLs a ellas. Si no lo hay, estas páginas antiguas/abandonadas deberían devolver un código de estado 404 o 410.
3. Un error de sintaxis al generar los sitemaps: Estos crean URLs erróneas, que pueden seguir devolviendo contenido y crear duplicados, o devolver errores HTTP.
Cómo solucionarlo: Si detectas URLs erróneas creadas por un error de sintaxis, ponte en contacto con tu equipo de desarrollo para colaborar en una solución.
4. Un error de sintaxis al generar etiquetas canónicas: Esto crea URLs erróneas. Estas URLs pueden servir códigos de estado 200 OK o códigos de error.
Cómo solucionarlo: Si detectas URLs erróneas creadas por un error de sintaxis, ponte en contacto con tu equipo de desarrollo para colaborar en una solución.
5. Páginas importantes de alta calidad que no están enlazadas en la estructura de su sitio web: Algunos sitios web utilizan páginas de navegación (listas de contenido, como páginas de categorías o páginas de resultados de búsqueda interna) que sólo se enlazan cuando se cumplen uno o varios criterios. Por ejemplo, las subcategorías sólo aparecen en un menú cuando la lista no está vacía o alcanza un número mínimo de elementos. Sea un error de automatización o no, hay muchos casos en los que podemos descuidar los enlaces a páginas de gran valor.
Cómo solucionarlo: Lo correcto es determinar cuándo una página deja de ser objetivo de tráfico orgánico según los criterios de negocio, y cuando lo sea, eliminarla de una vez por todas: quitar los enlaces y devolver el HTTP 404 o 410. Hasta entonces, siempre debe estar enlazada en algún lugar del sitio web.
Tengo identificadas mis páginas huérfanas ¿Y ahora qué hago?
- Consultor SEO en Getafe - 27 marzo, 2023
- Consultor SEO en Fuenlabrada - 25 marzo, 2023
- Consultor SEO en Coslada - 23 marzo, 2023