martes, 5 de junio de 2012

QUE ES UN BUSCADOR


Los buscadores en Internet, son programas o aplicaciones que residen en un sitio o página web, los cuales, al ingresar palabras en sus recuadros de búsqueda, operan dentro de la base de datos del mismo buscador y recopilan todas las páginas que contengan información relevante y relacionada con lo que se busca; de hecho este es el principal desafío que enfrentan las compañías que brindan este servicio, el ser capaces de brindar un orden al verdadero océano de información que es la web (hablamos de red o web también para referirnos a la Internet). Las palabras que ingresamos en los recuadros para buscar se denominan en el medio "palabras clave", o "keywords" en inglés, por su importancia para obtener la información necesaria de la gran base de datos que maneja cada buscador.

HISTORIA DE LOS BUSCADORES




El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por la World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento. El primer motor de búsqueda de texto completo fue WebCrawler, que apareció en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar para la gran mayoría de los buscadores. WebCrawler fue también el primero darse a conocer ampliamente por el público. También apareció en 1994 Lycos (que comenzó en la Carnegie Mellon University).

PRIMER MOTOR DE BUSQUEDA



Un motor de búsqueda, también conocido como buscador, es un sistema informático que busca archivos almacenados en servidores web gracias a su «spider» (o Web crawler). Un ejemplo son los buscadores de Internet (algunos buscan únicamente en la web, pero otros lo hacen además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direccions web en los que se mencionan temas relacionados con las palabras clave buscadas.
Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en día Internet se ha convertido en una herramienta, para la búsqueda de información, rápida, para ello han surgido los buscadores que son un motor de búsqueda que nos facilita encontrar información rápida de cualquier tema de interés, en cualquier área de las ciencias, y de cualquier parte del mundo.
CLASIFICACIONES DE LOS BUSCADORES


Indices

Son los buscadores que mantienen una organización de las páginas incluidas en su base de datos por categorías, es decir, tienen un directorio navegable de temas. Dentro de cada directorio podemos encontrar páginas relacionadas con ese tema. Para mantener esta organización, los buscadores tienen unos administradores humanos que se encargan de visitar las páginas y vigilan que todas se encuentren clasificadas en su lugar correcto. Índices típicos son Yahoo, Terra o TodoEnlaces.

Para que una página quede registrada en un índice debemos mandarles la dirección a los administradores humanos de ese índice, generalmente acompañada de una serie de datos que les ayuden a clasificar la página de una forma correcta, como la descripción, temática, titulo, lenguaje, etc. Además, si queremos que varias páginas de nuestro sitio web estén en el buscador, deberemos registrarlas todas ellas una a una.

Motores de búsqueda
Son buscadores que basan su recolección de páginas en un robot, denominado araña, que recorre constantemente Internet en busca de páginas nuevas que va introduciendo en su base de datos automáticamente. Los motores de búsqueda, no tienen porque tener un índice, aunque cada vez es más habitual que dispongan de uno. Motores de búsqueda típicos son Altavista o Sol.

Nota: Google también es un motor de búsqueda y en estos momentos, es el más utilizado de Internet. Es curioso porque, a pesar de que a todo el mundo le parece el motor imprescindible y no hay nadie que no lo conozca, es un motor de búsqueda bastante nuevo. De hecho, cuando se redactó este artículo todavía no existía, o por lo menos no se conocía.

Los motores de búsqueda, como se puede haber deducido, no necesitan que les mandemos la dirección de nuestra página para tenerla en su base de datos, puesto que el robot puede haberla encontrado previamente. De todos modos, nosotros podemos mandarles la dirección si no deseamos esperar a que el robot nos encuentre, practica muy habitual.

Para clasificar una página, los motores de búsqueda son capaces de leer el contenido de esta y encontrar aquellos datos que permitan su catalogación. Por esto es que cuando registramos una página en un motor de búsqueda generalmente no nos piden información adicional, como ocurría con los índices.

Cuando un robot recorre nuestra página guarda sus datos, y luego se dirige a las distintas páginas que están enlazadas a esta. De este modo, solo hace falta registrar la página inicial de un sitio web, pues el motor de búsqueda se encargará de recorrer todo el sitio de manera automática. Adicionalmente, estos motores o arañas, volverán a recorrer las páginas de su base de datos en busca de cambios que se hayan producido en estas, con objetivo de mantener su información lo más actualizada posible.

Multibuscadores

Estos últimos no tienen una base de datos propia, lo que hacen es buscar la página en unos cuantos motores de búsqueda e índices y combinar los resultados de la búsqueda en esos buscadores. Como ejemplos de multibuscadores podemos destacar Metacrawler.

Para registrar una dirección de manera que aparezca en un multibuscador debemos mandársela a los algún buscador donde este va a recoger los resultados.
QUE ES UN METABUSCADOR



El metabuscador es un sistema que localiza información en los motores de búsqueda más usados y carece de base de datos propia y, en su lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada uno. Un buscador normal recopila la información de las páginas mediante su indexación, como Google o bien mantiene un amplio directorio temático, como Yahoo. La definición simplista sería que un metabuscador es un buscador en buscadores

PRINCIPALES BUSCADORES

Cada motor de búsqueda tiene su propia forma de recorrer el mayor número posible de páginas existentes en internet y crear su índice interno. En general, esta tarea se realiza automáticamente, a través de programas llamados robots o spiders.

Altavista



es un buscador en inglés y español, de la empresa Overture Service Inc. comprada a su vez por Yahoo!. Su sede se encuentra en California y se realizan unas 61.000 búsquedas cada día

AOL


Inc. (NYSE: AOL), anteriormente conocida como America Online, es una empresa de servicios de internet y medios con sede en Nueva York. Ha franquiciado sus servicios a empresas en varios países alrededor del mundo o establecido versiones internacionales desus servicios.

Ask.com


 también conocido como Ask Jeeves, es un motor de búsqueda de Internet. Es parte de la compañía InterActive Corporation, fundada en 1996 por Garrett Gruener y David Warthen en Berkeley, California. El programa original fue implementado por Gary Chevsky basado en su propio diseño. Los primeros inversionistas fue el Grupo RODA

QUE ES UN DOCUMENTO HTML


HTML, siglas de HyperText Markup Language («lenguaje de marcado de hipertexto»), hace referencia al lenguaje de marcado predominante para la elaboración de páginas web que se utiliza para describir la estructura y el contenido en forma de texto, así como para complementar el texto con objetos tales como imágenes. El HTML se escribe en forma de «etiquetas», rodeadas por corchetes angulares

PARA QUE SE UTILIZA EL PROTOCOLO DE HTTP

El protocolo de transferencia de hipertexto (HTTP, HyperText Transfer Protocol) es el protocolo usado en cada transacción de la Web (WWW). HTTP fue desarrollado por el consorcio W3C y la IETF, colaboración que culminó en 1999 con la publicación de una serie de RFC, siendo el más importante de ellos el RFC 2616, que especifica la versión 1.1.
HTTP define la sintaxis y la semántica que utilizan los elementos software de la arquitectura web (clientes, servidores, proxies) para comunicarse. Es un protocolo orientado a transacciones y sigue el esquema petición


No hay comentarios:

Publicar un comentario