Uma bagunça organizada: os sistemas de busca
De Ciberespaço
Um estudo realizado pelo NEC Research Institute chegou à assustadora estimativa de que já há mais de 320 milhões de páginas na Web. Esse número é impressionante. Só para se ter uma idéia, a Biblioteca do Congresso dos Estados Unidos, a maior do mundo, tem 20 milhões de livros catalogados.
Algumas pessoas podem imaginar, então, que esses milhões de páginas pessoais e comerciais poderiam transformar a Web numa enorme bagunça, tornando impossível encontrar qualquer coisa nesse grande amontoado de informações. Felizmente, isso não acontece. A Web é hoje uma espécie de “bagunça organizada”. Graças aos sistemas de busca e aos catálogos existentes na Web, tornou-se possível encontrar informações com rapidez e eficiência.
· Sistemas de busca. Esses sistemas possuem gigantescas bases de dados que armazenam cada palavra de milhões documento da Web! Esta indexação é feita por “robôs” (programas que navegam automaticamente pela Web e armazenam na base de dados o conteúdo de toda e qualquer página encontrada). As buscas são feitas a partir de palavras-chaves fornecidas pelo usuário. O sistema de busca mais famoso é o AltaVista. Ele foi criado em 1995 nos laboratórios de pesquisa da Digital Equipment Corporation (adquirida no início de 1998 pela Compaq) em Palo Alto, Califórnia. O AltaVista tem uma base de dados com centenas de gigabytes, realiza milhões de buscas por dia e funciona em computadores poderosíssimos.
· Catálogos. Os catálogos, ou diretórios, são coleções de links organizados por assuntos. Nesses catálogos, a inclusão de novas páginas não é feita por programas-robô, mas por seres humanos. A vantagem, em relação aos sistemas de busca, é que há certa preocupação com a qualidade das páginas catalogadas; elas não são escolhidas a esmo, mas selecionadas. Além disso, os catálogos também permitem encontrar páginas através de buscas por palavras-chave. O catálogo mais famoso na Web é o Yahoo! Ele começou como um hobby de dois estudantes da Universidade de Stanford, Jerry Yang e David Filo, e hoje se tornou um dos sites mais acessados da Web.
Mas não pense que a Web é um poço inesgotável de informações e que você encontrará tudo com um clique do mouse! Saber consultar os sistemas de busca e os catálogos é fundamental. Isso vai exigir do usuário tempo, paciência e algum conhecimento da língua inglesa.
Vejamos alguns exemplos:
· Suponha que você quer encontrar a letra do hino nacional brasileiro. Fornecendo ao AltaVista as palavras-chave “ouviram do ipiranga” (não se preocupe com maiúsculas ou acentuação), você obtém uma relação de 28 páginas em que esta frase aparece. Acessando algumas destas 28 páginas, encontra-se o hino sem dificuldades. Esses sistemas são úteis, portanto, para encontrar citações, letras de músicas, poesias e até pessoas (basta fornecer o nome completo da pessoa).
· Imagine agora que você precise fazer um trabalho sobre clonagem (cloning, em inglês). Usando cloning como palavra-chave no AltaVista, obtemos mais de 200 mil páginas em que esta palavra aparece! Procurar informações relevantes no meio de tudo isso consumiria muito tempo. Por isso, acessamos um catálogo, como o Yahoo!. Neste catálogo, os assuntos são organizados em áreas. Como sabemos que clonagem é assunto de ciência, é nesta área que começamos. A partir daí, devemos seguir pelas diversas subdivisões da área, de acordo com o assunto. Em relação a clonagem, depois de Science vamos para Biology. Em seguida acessamos Genetics e por fim em Cloning. Nesta página encontramos dez links (previamente selecionados pela equipe do Yahoo!) sobre o assunto.
Além do AltaVista e do Yahoo!, existem muitos outros catálogos e sistemas de busca na Web. Cada um tem vantagens e desvantagens, cabendo ao usuário escolher o mais adequado à busca que realiza. Um sistema de busca interessante é o MetaCrawler, que não possui uma base de dados própria: ele faz pesquisas simultâneas em diversos outros mecanismos de busca, seleciona os resultados e depois retorna estes resultados para o usuário. Para encontrar páginas em português, um bom catálogo é o Cadê? e um bom sistema de busca é o Radar UOL.
AltaVista http://www.altavista.digital.com Cadê? http://www.cade.com.br Dejanews http://www.dejanews.com Excite http://www.excite.com HotBot http://www.hotbot.com Infoseek http://www.infoseek.com Lycos http://www.lycos.com MetaCawler http://www.metacrawler.com Northern Light http://www.northernlight.com Radar UOL http://www.radaruol.com.br Search.com http://www.search.com Surf http://www.surf.com.br WebCrawler http://www.webcrawler.com Yahoo! http://www.yahoo.com/

