¿Qué es el Thin Content y cómo detectarlo?

Thin Content

En el artículo de hoy hemos considerado oportuno abordar el concepto de «thin content» o contenido escueto/pobre porque, en base a nuestra experiencia, hemos podido comprobar que es uno de esos conceptos que se utilizan mucho en nuestro sector, pero del que mucho SEOs no saben exactamente a qué hace referencia ya que es mucho más amplio de lo se cree.

La primera vez que se consideró este concepto fue tras la actualización de Google Panda, el primer gran algoritmo de Google, en febrero de 2011 (en aquella época muchos todavía no sabíamos ni qué era el SEO).

Si quieres saber todo lo importante sobre el thin content y cómo trabajarlo con, la que consideramos, la mejor herramienta para detectarlo (SafeCont), te invitamos a seguir leyendo este artículo que hemos preparado con mucha ilusión para los SEOs del mundo.

¿Qué es el Thin Content?

El thin content es el contenido de una página web que aporta poco o ningún valor al usuario. Este concepto no solo engloba las páginas vacías o semi vacías como muchos piensan.

Tipos de páginas consideradas Thin Content

No existe un criterio oficial que nos indique que una página puede incluirse dentro del saco de “páginas inútiles” pues todas las páginas pueden serlo (hasta la Home). Sin embargo, con la experiencia somos capaces de encontrar patrones que nos permiten elaborar una clasificación de este tipo de páginas.

Páginas vacías o semivacías

No solo son las páginas pobres de contenido, sino que el contenido no aporte nada. Debemos recordar que la longitud del contenido no es un indicador de thin content ni de calidad. Si conseguimos al usuario todo lo que está buscando con poco contenido seguro que Google lo premiará. La mayoría de estos casos a los que suele enfrentarse un SEO están relacionados con páginas de resultados internos que se indexan, filtros poco trabajados o Tags.

Tags indexados SEO
Resultado de búsqueda aleatorio indexable
Tags Indexables SEO sin contenido
Página de TAGS indexables sin contenido

Para evitar que se produzca este tipo de thin content debemos tratar de evitar hacer indexable este tipo de páginas o controlarlo con mucho detalle. No debemos seguir este procedimiento en páginas que pueden suponer una buena solución a la consulta realizada por los usuarios en Google y creamos que se pueden posicionar tras una correcta optimización.

Página TAGs con contenido SEO
Ejemplo página de resultados de búsqueda indexada con contenido acorde
Filtros SEO
Ejemplo URL con filtro correctamente indexada
página TAG seo con contenidos
Página TAG indexable con contenidos afines.

En el caso de las tags, además recomendamos lo que ya se ha comentado en muchas ocasiones, generarlas con mucho cuidado y siempre siguiendo una estrategia SEO con sentido. De esta manera nos aseguramos que puedan ser utilizadas como una categorización secundaria tal y como se hace en muchos medios de comunicación.

Páginas con contenido duplicado

Esta es una de las prácticas más combatidas por Google, si un contenido no aporta información relevante y diferente a la de los competidores, no será reconocida por Google. Ni que decir tiene que copiar directamente los contenidos de otros portales supone que, en la mayoría de los casos, seas duramente penalizado por los motores de búsqueda.

También se considera contenido duplicado spinear textos, es decir, copiarlos y reescribirlos adaptándolos ligeramente. El bot de Google es capaz de detectar el plagio, aunque se cambien algunas frases.

Traducir el contenido desde otro idioma e incluirlo directamente en tu web, también se considera thin content.

Nuestro consejo es que no vayas por la vía rápida, si quieres hacer un buen SEO, cúrratelo, genera contenido interesante y te aseguramos que los resultados llegarán más pronto que tarde.

Contenido generado automáticamente

En este caso, hacemos referencia al contenido generado por herramientas o bots. Es cierto que la IA ha avanzado mucho y que se podrían generar textos relativamente interesantes, pero no deja de ser una práctica representativa del black hat más básico que tu web acabará pagando.

Los bots no son tontos y los usuarios tampoco. Generar contenido que no aporte nada al usuario actualmente en SEO Alive lo consideramos como la contraposición máxima del SEO.

No seas la cigarra de la fábula.

Contenido de afiliación de baja calidad

Los sitios web afiliados que ofrecen consejos de compra y reviews útiles y completas no tienen nada que temer de Google. Sin embargo, las páginas llenas de enlaces de afiliados que no ofrecen información útil o relevante para el usuario final son los objetivos principales para ser castigados por una penalización de Google

¡La de páginas de este tipo que se han llevado un disavow en auditorías de linkbuilding!

Para evitar este tipo de penalizaciones debemos asegurarnos de que la web tenga un propósito más allá de la oferta de afiliados y ofrecer oportunidades de afiliación que coincidan estrechamente con el sector de tu web

Páginas puerta o Doorway Page

Son fáciles de identificar porque han sido diseñadas principalmente para motores de búsqueda, no para seres humanos. Esta técnica, ya en desuso, consiste en crear varias páginas/dominios con el objetivo de posicionarse para un término muy específico o un grupo muy cercano de términos y enlazarlas o redirigirlas todas hacia una misma URL.

Los típicos contenidos que se utilizan en estas páginas, son similares a estos:

paginas puertas doorway pages seo
Ejemplo de página puerta o doorway page.

Bajo nuestro punto de vista, es una estrategia arcaica que en el SEO actual supondría mayor esfuerzo que resultado y por supuesto es thin content.

¿Cómo afecta el thin content a una web?

Tenemos que matizar que el thin content suele ser penalizado en webs que se encuentran demasiado desoptimizadas, que representan un caos estructural y de contenidos que ni Google es capaz de identificar o en aquellas en cuya construcción se ha optado por la vía “fácil” utilizando alguna (o muchas) técnicas blackhateras.

El principal inconveniente que supone generar thin content en una web es que esta se expone a que sea duramente penalizada por Google impidiendo que consiga un buen posicionamiento en las SERP o haciendo que la posición caiga de manera continuada.

Pero no es ese el único inconveniente, pues si una web consigue recibir visitas desde cualquier canal, será difícil que consiga retener y convencer a sus usuarios de que interactúen. En la situación en la que se encuentra el SEO actualmente, donde el usuario es el protagonista, este hecho provocará que se potencia la pérdida de autoridad.

Cómo detectar el thin content con Safecont

Después de todo lo que ya sabías y de leer todo esto, seguro que no quieres permitir que tu web tenga ni un ápice de contenido inútil. Como te acabamos de decir si tienes una estrategia de contenidos de calidad y tu web presenta un nivel de optimización apropiado no debes preocuparte, pero si te recomendamos que controles este tipo de páginas, especialmente por los usuarios que pueden recabar en ellas.

Para ello, nos parece muy oportuno hablar de una de las herramientas que mejor nos está funcionando en nuestra agencia, queremos que la conozcáis por si, como a nosotros, te puede ser útil en tus auditorías de contenido.

Decirte, para los que no la conocéis que Safecont es una herramienta española especializada en el análisis de contenido y arquitectura que utiliza tecnología de Machine Learning para detectar dónde se encuentra los principales problemas de un sitio web. Con ella podemos detectar contenidos de baja calidad que puedan conllevar penalizaciones y otros problemas.

Como el tema principal del artículo es el thin content, vamos a centrarnos exclusivamente en el análisis de este que realiza la herramienta. Una vez crawleada la web, en primera instancia, en el resumen del crawleo ya encontramos el número de URLs que presentan este problema.

cuadro de mandos Safecont
Vista general del dashboard de la herramienta SEO Safecont.

Si profundizamos en el análisis específico…

Thin Content Safecont
La función de detección de thin content es una de las mejores de la herramienta.

Ya encontramos un resumen muy visual y muy correcto del estado de la web.

Análisis Clusters Safecont
Vista general del análisis de clusters de SafeCont.

Lo primero que nos va a llamar la atención, sin duda, es la particular gráfica en forma de rinoceronte (logo de la herramienta ya que un panda hubiese sido muy obvio) que nos muestra el porcentaje del riesgo de sufrir una penalización.

Riesgo penalización SEO
Gráfico del riesgo de penalización de Safecont.

Según este análisis, la web cumple con el nivel óptimo de thin contenido y, de momento, Google no tiene motivos para penalizarlos.
Debajo de este análisis vemos una tabla y un gráfico muy curiosos y representativos que nos permiten vislumbrar de manera genérica el estado de la web:

Thin Content Clusters
Análisis de thin content mediante clusters.

En la tabla se nos muestran tres columnas:

  • Links: que nos ofrece por intervalos de 10 el porcentaje de thin content que pueden tener las páginas.
  • Pages: el número de páginas que presentan cada porcentaje de thin content.
  • Cluster Risk: la posibilidad que tienen de ser penalizadas cada una de las páginas dentro de cada intervalo.

Sabemos que dicho así puede parecer un poco lioso, pero la forma correcta de interpretarlo vendría siendo algo así:  “Observamos que la mayoría de las páginas (706) presentan un porcentaje de thin content entre el 10 y el 20% teniendo una posibilidad media de ser penalizadas del 29,81%.

Tan solo cuatro páginas tienen un porcentaje de thin content superior a 40% y la posibilidad de ser penalizadas es de 36,98%.”

El gráfico viene a representarnos esto, diferencia cada intervalo por colores siendo el verde el de menor porcentaje de thin content y el rojo el de mayor. Por esto el segundo intervalo (10%-20%) es el que se representa de forma más gruesa.

Y por último…

Análisis URL Safecont
Análisis individualizado de urls (thin content, riesgo penalización…)

Safecont nos muestra un análisis individual de cada URL pudiendo filtrar como deseemos. Acompañando a las URLs nos aparecen 3 datos:

  • ThinRatio: porcentaje de palabras similares dentro de la misma página
  • NUMWORDS: densidad de palabras que se incluyen en el contenido
  • PAGERISK: probabilidad de que la página pueda ser penalizada.

Como hemos dicho durante el artículo, no nos podemos centrar únicamente en la extensión del contenido, como se centra en esta última parte la herramienta. Sin embargo, si es algo que debemos tenerlo en cuenta.

Esta herramienta debe ser comprendida de manera global ya que nos permitirá hacer auditorías de contenido de mucha calidad. Te recomendamos encarecidamente que la pruebes.

* Nota: Este artículo no ha sido patrocinado sino que realmente creemos que Safecont aporta valor y es de gran calidad y por lo tanto consideramos oportuno compartirla con la comunidad SEO.

Sobre el autor:

Ayúdanos compartiendo este artículo por favor

Artículos relacionados

Deja un comentario

INFORMACIÓN BÁSICA SOBRE PROTECCIÓN DE DATOS