jueves, 1 de junio de 2017

Redes y arañas

En el mundo de la red, se entiende por araña o spider a los programas que enlazan nuestros criterios de búsqueda con una lista de resultados que se adecue a ellos. Así, los más famosos serían Google, Yahoo, Bing... sin embargo, se calcula que existen más de 1000. Esto se comprende si tenemos en cuenta que varios grupos de investigación cuentan con su propio spider propio.

Por tanto, las funciones principales de los spiders serían la de explorar nuevas URL para añadir a su lista de exploraciones y extraer el contenido para indexarlas. Sin embargo, el spider propiamente dicho tan solo realizaría la primera función de exploración de manera autónoma, con capacidad de interactuar con los enlaces que visite. Cabe señalar que los resultados de las búsquedas no siempre serán objeto de indexación. Por ejemplo, las páginas web de un país que establezcan en sus leyes que no desean ser exploradas por el buscador en cuestión.


Fuente: http://bit.ly/2rpeXiB (Tras búsqueda de resultados etiquetados para reutilización no comercial).

Así, la otra función de extracción de datos, indexación y publicación de los resultados correría a cargo de una unidad humana, la cual desempeñará un papel crucial a la hora de cliquear nuestras páginas web más frecuentes.

En los buscadores comerciales, se muestran en la primera página de resultados aquellos que se adecuen al proceso que se sigue para su publicación. Sería lógico pensar que los resultados están ordenados en función de la calidad de la información de las distintas páginas, siendo el primer enlace el mejor. Esto no es exactamente así, ya que intervienen otros muchos factores. Entre los más influyentes, encontraríamos la presencia social de la página, el tiempo de permanencia de sus usuarios en ella, el número de visitas que recibe, los enlaces dentro del sitio... y por supuesto, si la página en cuestión ha pagado o no para estar entre los principales resultados. También entraríamos a jugar nosotros en esta ecuación indirectamente con nuestras búsquedas principales, ya que estas quedan almacenadas como cookies que posteriormente usará nuestro buscador para colocar anuncios que se ajusten a estas en búsquedas posteriores.

Para concluir, podemos afirmar que la red es una herramienta de búsqueda de información muy importante y casi indispensable en los tiempos que corren. En ella se alberga información válida pero también no válida, por lo que se debe de saber realizar las conductas apropiadas para obtener los resultados que queremos nosotros y no los que quieren unos terceros y, si es una búsqueda científica, emplear la búsqueda avanzada en bases de datos bibliográficas, catálogos, etc.

Bibliografía:

Codina, L. (12 de junio de 2015). Google para Periodistas (1): Cómo encuentran información los buscadores o vida de una araña cibernética [Mensaje en un blog]. Recuperado de: https://www.lluiscodina.com/google-para-periodistas-como-funcionan-rastreadores/

Codina, L. (15 de junio de 2015). Google para Periodistas (2): La fórmula N/2 o lo que Google quiere y no quiere que veamos [Mensaje en un blog]. Recuperado de: https://www.lluiscodina.com/google-para-periodistas-lo-que-quiere-que-veamos/

(Entrada correspondiente al subapartado 2.1. La información que encontramos en los buscadores generalistas)

No hay comentarios:

Publicar un comentario