Acerca del archivo robots.txt

Robots

El archivo robots.txt es el encargado de decir pase o quedese ahí a los robots de los buscadores como en este caso el spider de google por ejemplo con este archivo podemos indicar al buscador de google que no acceda por ejemplo al feed u otras secciones de nuestro blog.

Es demasiada util para que no se indexen paginas que no deseamos que sean vistas por los buscadores ya que podrian generar contenido duplicado y este arhivo nos puede sacar de mas de un problema.

Utilizamos:

Disallow: Para especificar la URL que no puede ser rastreada
User-Agent : Indicamos que robot no ingresara en esas URL

El archivo tiene que estar justo en el directorio principal de nuestra web para que el robot pueda acceder a el.

Puedes buscar herramientas para generar el archivo o lo puedes crear tu mismo, por ejemplo te muestro el que yo tengo en el blog.

HTML:
  1. User-agent: Googlebot
  2. Disallow: /*/feed/$
  3. Disallow: /*/feed/rss/$
  4. Disallow: /*/trackback/$
  5. User-agent: *
  6. Disallow: /wp-
  7. Disallow: /feed/
  8. Disallow: /trackback/
  9. Disallow: /rss/
  10. Disallow: /comments/feed/
  11. Disallow: /page/
  12. Disallow: /date/
  13. Disallow: /comments/

Claro que tu puedes crearlo como tu quieras o como mejor se acomode a tus necesidades y las de tu blog.

mito | Febrero 7, 2008| SEO

Etiquetas:, | Agrega un Comentario

Plantillas Blogger

  Ver Todas


Recomendados

Suscribete al Feed

Recibe en tu correo diariamente las ultimas noticias

Categorias

Sitios Amigos