Son motores de búsqueda es una pieza de software que permite encontrar y visitar los sitios relacionados con una palabra clave -o keyword- introducida al sistema por el mismo usuario. También se los denomina buscadores. Básicamente, están compuestos por bases de datos gigantescas que contienen información sobre el contenido.
• Construidos por programas de computador robotizados, arañas "spiders". Sin que intervenga el ser humano en la selección.
• NO están organizados por categorías de temas. Todas las páginas están clasificadas (ranked) por un algoritmo de computador.
• Contienen textos completos (cada palabra) de las páginas de la red que enlazan. Usted encontrará páginas utilizando palabras que coinciden con las que están en las páginas que usted desea.
• Capturan con frecuencia gran cantidad de información. Para búsquedas complejas utilice aquellos que le permiten buscar por dentro de los resultados (sub searching)
• NO evaluados. Contienen lo bueno, lo malo y lo feo. Usted debe evaluar todo lo que encuentre (más sobre evaluación:) more on evaluating
DE LOS SITIOS QUE INTEGRAN LA WEB.
¿Qué tipos de motores hay?
Según como trabajen encontraremos:
1. Buscadores propiamente dichos o spiders
2. Directorios Índices, Catálogos
3. Sistemas Mixtos (directorio y motor de búsqueda)
4. Meta buscadores
5. Multibuscadores
6. Buscadores de portal
1. Buscadores propiamente
Dichos o spiders
La mayoría de los grandes buscadores internacionales que todos usamos y conocemos entran dentro de esta denominación. Requieren muchos recursos para su funcionamiento. Las arañas recorren páginas y recopilan información sobre su contenido, y las presentan clasificadas por orden de relevancia. Por ejemplo, si buscamos una palabra, [traducción], los resultados de la búsqueda nos mostrarán las páginas que contengan esta palabra en alguna parte del texto. En algunos casos registran todas las páginas del sitio, y en otros, sólo algunas. Además, las arañas van recopilando las actualizaciones, cuya periodicidad depende del motor en cuestión. Por este motivo, puede suceder que algunos sitios no aparezcan actualizados. El orden de relevancia, es decir, el orden en que se muestran los resultados de la consulta, está determinado por diversos factores que dependen de cada buscador. Pueden existir distintos parámetros, pero existen muchísimas estrategias, que las distintas empresas elaboran para lograr los primeros puestos.
Ejemplos de buscadores "spiders"
Google, Altavista, Lycos
2. Los Directorios
Son motores buscadores totalmente distintos a las arañas. Son listas de recursos organizados por categorías temáticas que se estructuran jerárquicamente en un árbol de materias que permite visualizar los contenidos desde los más generales, en las ramas superiores, a los más específicos, en las ramas inferiores. Más que buscar información sobre contenidos de la página, los resultados serán referencias a los contenidos y a la temática de la Web. Es decir, si buscamos "traducción", aparecerán los sitios que de una forma u otra estén relacionados con la temática de la traducción. Su tecnología es muy barata y sencilla. Pero el costo de operación es relativamente alto, ya que dependen de la operación manual. La clasificación y categorización requieren una intervención humana y en muchos casos, debido a la heterogeneidad de los temas tratados, algunas páginas presentan problemas de categorización ya que los índices suelen mantener su base de datos de forma manual.
¿Cómo trabajan?
Los buscadores automáticos están compuestos por tres partes:
Los robots que se encargan de recorrer la Red
Escrutándola
La base de datos que construyen estos robots
El motor de búsqueda que facilita la consulta a la base
Los robots son programas que buscan o rastrean continuamente todos los servidores de la WWW, en Gopher (uno de los sistemas de Internet para recuperar información que precedió a la World Wide Web), y FTP, que alimentan una base de datos. Los robots actualizan estas bases y añaden nuevas páginas o referencias cuando ha cambiado o bien, cuando ya no existe. Google por ejemplo, guarda la página inicial y aunque la página ya no exista en la opción "caché", se puede ver la información original. Cuando abrimos la página de un buscador, encontramos un formulario para definir nuestra búsqueda y sus posibles opciones. Ingresamos la palabra o palabras clave que son las que describen los conceptos, ideas o términos que buscamos. El motor nos devuelve los resultados en función de cómo hayamos definido nuestra búsqueda.
Los buscadores temáticos o especializados están compuestos por:
Una base de datos creada a partir de los URL remitidos
Una estructura jerárquica que facilita la consulta De todas maneras, se tiende más a utilizar un sistema mixto con buscadores automáticos
Google
Encontrar todos estos recursos es un desafío. En la mayoría de los casos, se resuelve fácilmente con el uso de alguno de los motores de búsqueda que mencionamos en la primera parte de este coleccionable. El más popular sigue siendo Google, con el que se pueden realizar búsquedas bastante complejas, entre otras: Para buscar la definición de una palabra (en cualquier idioma), se puede escribir "define:" seguido de la palabra clave de búsqueda. Por ejemplo, define: localización mostrará este resultado:
Es posible buscar palabras o frases dentro de una página en especial, como la de un cliente. Por ejemplo, "trojan horse site: www.symantec.com" mostrará este resultado (aplicable a cualquier idioma)
Para buscar palabras en un sitio y en la dirección del sitio, se puede utilizar "inurl:". Por ejemplo, si queremos buscar la palabra "enfiteusis" y, que además aparezca en un glosario, escribimos "enfiteusis inurl:glosario", y se obtendrá este resultado:
Además de buscar en glosarios, también pueden buscar en páginas de clientes, empresas, etc. Para la conversión de unidades (millas a kilómetros, por ejemplo), basta con escribir "x miles", "x yards", etc... El resultado va a ser algo así:
Para buscar palabras en un tipo de archivo en especial: supongamos que se quiere buscar la palabra "localization" en un archivo PDF, si escribimos "localization filetype:pdf" se obtendrá algo así:
Listados: http://labs.google.com/sets.
Nos permite encontrar o completar listas de un conjunto de elementos (por ejemplo: si necesitamos una lista de marcas de automóviles, con incluir dos, Google completa el resto).
Google Desktop: http://desktop.google.com/ Desde este sitio, se baja el programa. Está diseñado con la misma tecnología de Google, es una herramienta de búsqueda instantánea pero... en los archivos de nuestra propia computadora. Permite buscar en correos electrónicos de Outlook, Outlook Express y en archivos de Word, Excel, PowerPoint y texto; también realiza búsquedas paralelas en el disco duro de nuestra computadora y en Internet. Yahoo, también tiene una herramienta similar.
Answers.com: www.answers.com
Es otra herramienta útil y a través de la cooperación con Google permite utilizar el buscador de Google y, al mismo tiempo, poder buscar palabras y hacer preguntas desde los sitios que estamos consultando.
Otros usos de los motores de búsqueda
Pero además, los motores de búsqueda son muy útiles no sólo para buscar términos, sino para verificar el uso, el estilo, las palabras que se utilizan con un determinado verbo, o el adjetivo más común para un sustantivo, y el análisis de los resultados, podría permitirnos esbozar hasta un registro de uso, y obtener información que no podemos conseguir en los diccionarios. Si utilizamos motores de búsqueda con mucha frecuencia, una herramienta útil, es Practisearch, que permite consultar el motor de búsqueda favorito con sólo seleccionar la frase en cuestión [desde cualquier programa, por ejemplo, Word, presionando una tecla de acceso rápido y luego enter].
La Web invisible.
Ideal para investigadores
La "Web visible" es lo que podemos "ver" con los motores de búsqueda, que presentan el contenido del sitio como resultado de una búsqueda. Lo que no se incluye en la mayoría de los casos, es el contenido de las bases de datos, por ejemplo. Si incluimos en los términos de búsqueda database (o base de datos) o directory podremos ver recursos de investigación útiles que los motores no pueden encontrar de otra forma, ya que las arañas de los motores de búsqueda no pueden catalogar el contenido que, por ende, queda relegado a lo que denominamos "Web invisible". Al final de este coleccionable, se detalla una lista de sitios Web, que incluyen sitios y programas utiles para buscar en la "Web invisible", como Direct Search, u OAIster, y permite buscar en las bases de datos de universidades o viejos artículos que no han sido generados en formato electrónico, y fueron escaneados.
Las búsquedas avanzadas
Este tipo de búsquedas no sólo permiten encontrar terminología sino textos especializados que nos pueden confirmar el¿ estilo, las elecciones tanto técnicas como estratégicas que deberemos hacer y, al mismo tiempo, podemos investigar sobre el tema que estamos traduciendo. Por ejemplo tomemos la biblioteca EUR-Lex en línea de la legislación de la Unión Europea. En este sitio se pueden buscar archivos html de la legislación de la Unión Europea en todos los idiomas oficiales. Y cada uno de estos archivos incluye los enlaces a las traducciones correspondientes en todos estos idiomas. De esta manera, una vez que encontramos el término, también encontraremos la traducción oficial del mismo término en la lengua meta.