ColCat: Acerca...

Teclado envia pesquisa, via ColCat, ao um conjunto de livros colocados acima do mesmo. A resposta é obtida pelos fios a eles ligados. Sobre o CC (ColCat)...

O ColCat, os motores de pesquisa e a web profunda / web invisível

Motores de pesquisa web como o Google ou o Sapo tem a informação nas suas bases de dados limitada à web superficial (visible web), que consiste no conjunto de páginas estáticas ou páginas dinâmicas pré-parametrizadas referenciadas noutras páginas link na barra de navegação "Recursos electrónicos" => "bases de dados"); O conteúdo destas páginas é sempre o mesmo para uma determinada URL.

Os diferentes conteúdos que uma página dinâmica pode ter, resultado de umapesquisa, desde algumas unidades a várias dezenas de milhões em grandes bases de dados, que variam de acordo com uma pesquisa ou acção do utilizador, não são visíveis para os "spiders" (robots dos motores de busca que percorrem a web, saltando de link em link, indexando as páginas encontradas). É por isso que estes conteúdos se dizem estar na web profunda (tradução livre de "deep web") ou web invisível (invisible web).

O ColCat também não indexa esses conteúdos; aliás, não recolhe nenhuma informação para uma base de dados local, como os motores de busca que indexam páginas web fazem. Pelo contrário, faz tudo em tempo real, simulando a interacção de um utilizador humano com os servidores remotos. Isto é feito de tal modo que estes servidores não conseguem distinguir o ColCat de um utilizador normal. Isto permite ainda que, se um registo é adicionado num desses servidores remotos, no segundo seguinte a mesma pesquisa no ColCat já apresente esse registo, caso este corresponda a essa pesquisa.

O ColCat pesquisa na web profunda das bases de dados de informação bibliográfica (OPACs).

A sua apurada base de inteligência permite-lhe "ler" e "compreender" as respostas dos servidores remotos, tendo sido "treinado" para saber analisar as diferentes respostas de cada um deles. É nesta inteligência, fruto de algumas dezenas de horas de programação e parametrização, que está o seu real valor, permitindo ao ColCat analisar os diferentes resultados dos vários catálogos remotos; diferentes quer no formato dos dados, quer no modo de apresentação.

A concepção e desenvolvimento do ColCat tornou-se possível perante a mudança de paradigma, com as bibliotecas a disponibilizarem publicamente a pesquisa nos seus catálogos (OPACs). Apesar de ter ficado numa fase operacional desde fins de 2002, só recentemente com o aumento da velocidade da ligação à internet das várias instituições, é que este atingiu um grau de resposta elevado, quer em termos de rapidez e de eficácia.

Com o ColCat, além de obter a informação desejada, também é possível pesquisar de uma forma integrada várias fontes ao mesmo tempo, apresentado em poucos segundos a relação dos resultados, normalizados e mostrados numa única página à medida que vão sendo obtidos; de outra forma, demoraria muito mais tempo.

CC: o novo nome do projecto ColCat

Equipa web SBIDM :: contacto
28 de Outubro de 2004, 21h56

<última actualização: 2015-03-18>

fechar