SEO

Scraper es un sitio web que copia todo su contenido de otros sitios, utilizando para ello diferentes métodos automatizados. En los últimos años, con la aparición de Google Adsense, los sitios Scrapers han proliferado como un hongo en invernadero, tanto así que los editores de contenido original se sienten incómodos por ello y los buscadores se están preocupando cada vez más, por identificar correctamente a cual sitio le pertenece tal contenido.

Con el crecimiento del contenido duplicado, los buscadores se ven obligados a aplicar formulas que les permitan identificar la fuente original, premiarla colocándola en buenas posiciones, y penalizando al sitio que duplica contenidos con fines poco éticos.

Un buscador que como resultado devuelva distintas webs con el mismo contenido, tendría un serio problema de calidad.

En ese sentido, Google acaba de publicar un post tocando el tema del contenido duplicado, de los Scrapers y de sitios, que sin ser Scrapers, también duplican contenido. Tema que no es nuevo, y que ha estado en el tapete del mundo SEO desde hace varios años, pero que actualmente se ha incrementado de manera notoria (sobre todo en nuestro idioma).

Contenido duplicado y Scrapers

Sólo hace falta realizar algunas búsquedas para comprobar que la eficacia de los buscadores aún no es la esperada. Muchas veces los agregadores, planets o redes sociales, en el ejemplo Menéame, suelen estar mejor posicionados que la página a la que referencian. O un blog popular que referencia un contenido, suele ubicarse en mejor posición que el sitio original.

Así pues, en este artículo vamos a ver varios tips SEO dados por el blog oficial de Google y por Vanessa Fox, en su blog personal, entre otros...

La respuesta la da SEJ, y aquí la resumimos: Los subdominios y subcarpetas tienen sus ventajas y desventajas, dependiendo de lo que se intenta conseguir.

En el caso de los blogs por ejemplo, se recomienda utilizar una subcarpeta (http://www.baluart.net/blog/) porque el link juice que se envía al blog termina distribuyéndose naturalmente y compartiéndose con el dominio principal, y otras subcarpetas que estén bajo el dominio.

En este caso, utilizar una subcarpeta para nuestro blog, o incluso foro, favorece a incrementar el valor del dominio.

Con un subdominio, en cambio, el foro o blog se considerará como una web separada en los resultados de Google, por lo que muchos spammers utilizan subdominios para escalar posiciones y aparecer repetidamente en el buscador. Sin embargo, Google y otros motores de búsqueda, ya no incluyen más de dos subdominios en los resultados, a menos que demuestren que efectivamente pertenecen a entidades independientes...

CĂłmo administrar lo que Google muestra de mi web

En un principio, todos estamos felices cuando nuestra web aparece por primera vez en el buscador. Pero pasa el tiempo, y uno se va percatando que el contenido que se muestra indexado al realizar una consulta es clave para atraer más tráfico, o hacer branding de nuestra web... ¿Saben ustedes que hay algunas formas de manejar este contenido? ...

Hasta ahora era difícil entender cómo es que Google Sitemaps tenía una herramienta para analizar el estado de los ficheros robots.txt, pero no una que permita crear o guardarlos. Sin embargo, y seguro que a requerimiento de los usuarios, Google Webmaster Tools acaba de lanzar una herramienta que nos permite crear los archivos robots.txt fácilmente y comprobar así, que nuestro sitio es accesible por todos los buscadores, o sólo por aquellos que permitamos.

robot-txt-google-sitemaps

Para acceder a la herramienta, hay que Iniciar sesión en GWT -> Ingresar en el dominio respectivo -> Menú Herramientas -> Generar archivo robots.txt.

La herramienta es muy intuitiva y fácil de manejar. Luego de descargar el archivo robots.txt, no olviden subirlo al directorio raíz de su site.

Artículo relacionado: Generador de robots.txt

mahalo-greenhouse Aaron Wall ha criticado duramente a Mahalo (¿Qué es Mahalo?), considerándolo una Web spam. Sustenta su opinión en documentos internos de Google que definen a un sitio que hace spam (spamblog, por ejemplo) de la siguiente manera (traducción propia):

Notas finales sobre spam

Cuando tratemos de decidir si una página Web es spam, debemos hacernos esta pregunta: ¿Si luego de eliminar el contenido copiado, la publicidad y los enlaces a páginas externas, nos queda algo de valor? Si la respuesta es no, la página probablemente es Spam.

Mahalo está en el primer puesto para esta bĂşsqueda (mahalo.com/Best_Computer_Speakers) sin tener contenido original, o único, o valioso según el buscador, dice el autor de SeoBook.

Hay que mencionar que Mahalo paga a sus editores por crear estas páginas (Mahalo Greenhouse), y pone publicidad en cada una de ellas. ¿Será Mahalo una web a lo spam 2.0?

A medida que van pasando las semanas, los meses, tal ves años, el contenido de una web va incrementándose enormemente, en especial si tienes un blog. Y los enlaces que uno comparte, con el tiempo van dejando de funcionar. Los sitios cambian, o algunos desaparecen. Es por ello, si no tienes la intención de malgastar parte de tu PageRank en enlaces que no llevan más que a paginas nulas, podemos servirnos de Dead Links, una útil herramienta que sirve para detectar los enlaces rotos de un sitio web.

CĂłmo descubrir los enlaces rotos de una web

Dead Links funciona al mismo estilo que una araña: Analiza el contenido de una página web, descubre los enlaces y va saltando de página en página, identificando casi todos los enlaces rotos que vaya encontrando durante su escaneo.

¿Cómo funciona? Su uso es tan simple como añadir la dirección URL de la página web a escanear.

Enlace | Dead Links

SuscrĂ­bete

  • Suscribete a nuestro feed
  • Add to Google Reader or Homepage
  • Subscribe in NewsGator Online
  • Add to My AOL
  • Subscribe in Bloglines
  • Add to netvibes