El Centro Aragonés de Tecnologías para la Educación (CATEDU) depende del Departamento de Educación, Cultura y Deporte del Gobierno de Aragón: Es CIFE de formación a distancia del profesorado y ofrece servicios destinados a incentivar y facilitar el uso de las TIC en la educación.

Valoración del Usuario: 0 / 5

estrella inactivaestrella inactivaestrella inactivaestrella inactivaestrella inactiva

Indexado de contenido de las páginas web en buscadores.

Al solicitar un nuevo servicio en el CATEDU, deberemos de ser conscientes que existe la posibilidad de que buscadores como google, yahoo, msn, ....periódicamente rastreen el contenido de las páginas web usando para ello diferentes aplicaciones conocidas popularmente como "robot" o "araña". Como podemos comprobar con el siguiente listado, existe un gran número de aplicaciones para realizar el indexado de contenido.

http://www.robotstxt.org/db.html

El problema, podría surgir si por ejemplo nuestra aplicación contiene datos privados (datos de usuarios de inscripción a un curso, de solicitud de alta de un portal, etc) y google u otros buscadores indexaran este contenido, pudiendo aparecer la información en el resultado de una búsqueda, la cual sería accesible a todo "el mundo".

Vamos a tratar de explicar con ejemplos, problemas que pueden ocurrir:

  • Tenemos una página web dinámica, la aplicación se ha desarrollado, por ejemplo, con php. Si no realizamos ningún control de acceso al contenido de esta aplicación, corremos el riesgo de que el robot visite alguno de los sitios web y detecte vínculos de nuestra página web dinámica, que por ejemplo generen una consulta a nuestra base de datos, pudiendo entonces aparecer la información resultado de la consulta del vínculo en las búsquedas realizadas por los usuarios de cualquier buscador.
  • Página web estática. Creamos una archivo html; todo lo que contenga este archivo html, podrá ser indexado por un robot.

Por tanto, sería importante que siempre que vayamos a manejar información de usuarios en nuestras aplicaciones controlemos el acceso a esa información, mediante un formulario de acceso, mediante sesiones, etc. Aplicaciones como Joomla, Scrapbook, SPIP, WIKI y las aplicaciones desarrolladas por el CATEDU, como Libros electrónicos, Formularios, ya nos ofrecen este tipo de control de acceso a las aplicaciones.

No olvidar que deberíamos realizar la codificación en las bases de datos de todo aquello que no queramos que sea accesible por otros usuarios (por ejemplo de los passwords).

Más información de indexado y robots en:

Finalmente, en caso de que su aplicación vaya a contener información que pueda resultar privada para los usuarios deberá de indicarlo en el formulario de creación de nuevo servicio y el CATEDU deshabilitará el acceso de robots de indexado al contenido de su aplicación web, evitando de este modo problemas como los que se indicaron anteriormente. Si al CATEDU no se le indica en ningún momento esta posibilidad, no se hará responsable de que pueda ocurrir alguna incidencia con el indexado realizado en su aplicación web.

Indexado de contenidos de las páginas web en buscadores.

 

ACEPTO