¿Qué son las páginas huérfanas?
Las páginas huérfanas son páginas del sitio web que no están enlazadas desde ninguna otra sección de tu sitio. Esto significa que un usuario no sabe a dónde ir después para obtener más información porque tu página no está vinculada a otras secciones de tu sitio. Las páginas huérfanas no reciben autoridad o relevancia de otras, ya que no les llegan enlaces internos.
¿Cómo podemos detectar las páginas huérfanas en nuestro site?
Aquí te voy a dar una serie de consejos para poder localizar este tipo de páginas, porque como veremos un poco más adelante las páginas huérfanas no son buenas para el posicionamiento seo de tu web.
Para detectar esas páginas huérfanas tan poco beneficiosas para el seo de nuestra web podemos llevar a cabo estas acciones:
- Obteniendo un listado del Sitmemap XML. En este listado extraeremos todas las urls de las distintas entradas que hemos creado en nuestro gestor de contenidos o CMS
- Mediante Search Console obtener un listado de páginas que están generando impresiones, pero no hay clics o tráfico orgánico hacia ellas. Desde Search Console nos podremos descargar estas URLs
- Empieza a recibir reseñas y comentarios sobre tu negocio
- Mediante Ahrefs podemos exportar en un archivo todas aquellas urls que tienen enlaces externos entrantes. Esto mismo también lo podemos hacer desde Search Console, pero yo prefiero hacerlo desde Ahrefs.
- Con GA (Google Analytics) obtendremos todas aquellas urls que tienen tráfico, ya sea orgánico o de cualquier otro tipo.
- Y por último, de los Logs de nuestro servidor de los que podremos obtener un listado de todas las URLs HTML
De este modo obtendremos todas las URLs y sobre todo aquellas que reciben tráfico. A continuación, unimos todas las URLs en una lista y la comparamos con las URLs obtenidas en un rastro completo del site, obtendremos de este modo las páginas huérfanas.
Otro método mucho más sencillo es la utilización de un crawler como Screaming Frog. Para ello realiza un crawleo y una vez realizado te vas a la pestaña Internal. En esta pestaña la herramienta seo te va a mostrar el número total de enlaces internos entrantes que va a tener una URL determinada. Si observas que tiene 0 enlaces internos, esa es una página huérfana.
Herramientas SEO para detectar páginas huérfanas
- Google Search Console: Esta herramienta gratuita de Google permite a los propietarios de sitios web identificar las páginas huérfanas en su sitio. Para utilizarla, es necesario tener una cuenta de Google y verificar la propiedad del sitio web. Una vez que se ha verificado la propiedad, se puede acceder a la sección de Cobertura en Search Console y buscar páginas con errores de indexación o páginas excluidas.
- Screaming Frog: Esta herramienta de auditoría SEO también permite identificar las páginas huérfanas de un sitio web. Es una herramienta de pago, pero ofrece una versión gratuita limitada. Una vez instalada, se puede escanear el sitio web y buscar páginas sin enlaces internos. Screaming Frog también puede mostrar detalles adicionales sobre las páginas, como títulos y descripciones.
- Ahrefs: Esta herramienta de análisis de enlaces y SEO también puede identificar páginas huérfanas en un sitio web. Ahrefs tiene una función de exploración de sitio que permite escanear todo el sitio web en busca de enlaces internos y páginas huérfanas. Además, también proporciona información sobre los enlaces entrantes y salientes de las páginas.
- Semrush: Esta herramienta de análisis de SEO y marketing digital también puede identificar páginas huérfanas en un sitio web. Semrush ofrece una función de exploración de sitio que puede identificar páginas sin enlaces internos y también proporciona información detallada sobre las páginas, como títulos y descripciones.
Impacto de las páginas huérfanas en el SEO
Las páginas huérfanas pueden tener un impacto negativo en el SEO de un sitio web. A continuación, se detallan algunos de los efectos negativos que pueden tener las páginas huérfanas en el SEO de un sitio web:
- Disminución de la visibilidad de la página: Si una página no tiene enlaces internos que la conecten con el resto del sitio web, es probable que los usuarios no la encuentren o no sepan que existe. Esto puede disminuir la visibilidad de la página y hacer que reciba menos tráfico.
- Reducción de la indexación de la página: Los motores de búsqueda tienen dificultades para encontrar páginas huérfanas, ya que no están conectadas a través de enlaces internos. Esto puede afectar la indexación de la página en los resultados de búsqueda y hacer que sea menos visible para los usuarios.
- Pérdida de autoridad de la página: Los enlaces internos son una forma de transmitir autoridad de una página a otra. Si una página no tiene enlaces internos, es probable que pierda autoridad y sea menos relevante para los motores de búsqueda.
¿Por qué aparecen páginas huérfanas en nuestra página web?
Aquí os quiero mostrar distintos escenarios por los que pueden aparecer las páginas huérfanas y cómo solucionarlo:
1. Las páginas caducadas siguen devolviendo contenido: Algunos sitios web simplemente dejan de enlazar a contenidos caducados (como productos retirados del catálogo) y no devuelven un código de estado (como HTTP 404 o 410) para indicar que el contenido ya no existe. Como resultado, la página antigua sigue estando disponible.
Cómo solucionarlo: Además de eliminar los enlaces al contenido caducado, debes asegurarte de actualizar la página caducada con el código de estado adecuado. Si el contenido ya no está disponible, asegúrese de que el código sea 404 o 410.
2. Páginas que quedaron fuera de una migración anterior del sitio: Se trata de páginas que no se redirigen y, por tanto, el contenido antiguo podría seguir estando disponible.
Cómo solucionarlo: Si hay contenido similar en su nuevo sitio web, debería redirigir estas antiguas URLs a ellas. Si no lo hay, estas páginas antiguas/abandonadas deberían devolver un código de estado 404 o 410.
3. Un error de sintaxis al generar los sitemaps: Estos crean URLs erróneas, que pueden seguir devolviendo contenido y crear duplicados, o devolver errores HTTP.
Cómo solucionarlo: Si detectas URLs erróneas creadas por un error de sintaxis, ponte en contacto con tu equipo de desarrollo para colaborar en una solución.
4. Un error de sintaxis al generar etiquetas canónicas: Esto crea URLs erróneas. Estas URLs pueden servir códigos de estado 200 OK o códigos de error.
Cómo solucionarlo: Si detectas URLs erróneas creadas por un error de sintaxis, ponte en contacto con tu equipo de desarrollo para colaborar en una solución.
5. Páginas importantes de alta calidad que no están enlazadas en la estructura de su sitio web: Algunos sitios web utilizan páginas de navegación (listas de contenido, como páginas de categorías o páginas de resultados de búsqueda interna) que sólo se enlazan cuando se cumplen uno o varios criterios. Por ejemplo, las subcategorías sólo aparecen en un menú cuando la lista no está vacía o alcanza un número mínimo de elementos. Sea un error de automatización o no, hay muchos casos en los que podemos descuidar los enlaces a páginas de gran valor.
Cómo solucionarlo: Lo correcto es determinar cuándo una página deja de ser objetivo de tráfico orgánico según los criterios de negocio, y cuando lo sea, eliminarla de una vez por todas: quitar los enlaces y devolver el HTTP 404 o 410. Hasta entonces, siempre debe estar enlazada en algún lugar del sitio web.
Tengo identificadas mis páginas huérfanas ¿Y ahora qué hago?
- Los Emojis SEO y su Impacto en las Búsquedas - 13 septiembre, 2023
- ¿Qué es el SandBox de Google? - 27 agosto, 2023
- ¿Qué es un elace NoFollow y para qué sirven? - 10 agosto, 2023