DataGramaZero - Revista de Ciência da Informação - v.2  n.2  abr/00                            ARTIGO 01

A Classificação como Interface da Internet
Classification as Internet Interface
por Rosali Fernandez de Souza

 
Resumo: O presente artigo visa refletir sobre a Classificação como uma das interfaces relevantes da Internet. Não pretende ser de cunho  teórico. O objetivo primordial é apresentar uma contribuição sobre o tema do ponto de vista da organização e representação do conhecimento registrado visando a  recuperação de informação. Apresenta a Classificação como um processo fundamental da natureza humana e como tal merecedora de particular atenção no tratamento da informação na era eletrônica, especialmente no  contexto da Internet. Comenta sobre o ambiente Internet como sistema de informação . Apresenta  considerações  sobre o tema, não sob a perspectiva de serem "finais" mas na expectativa de suscitar  futuras contribuições visando enriquecer a discussão sobre como organizar e representar o universo do conhecimento registrado para fins de recuperação e acesso -  assunto    complexo e  desafiante, por vezes polêmico, mas de indiscutível importância  na era eletrônica.
Palavras Chave: Classificação; Internet;  Representação do Conhecimento; Conhecimento Registrado; Recuperação da Informação.

Abstract: This article aims to reflect on classification as a relevant internet interface. It is not intended to be a theoretical approach on the subject. The main purpose  is to present  a contribution on this matter from the point of view of knowledge organisation and representation aiming information retrieval. The work  starts by presenting Classification as a fundamental process of the human nature, and as such a subject of particular interest regarding treatment of information   in the electronic era, specially in the Internet context. It also comments on Internet as an information locus. Contributions on the subject are presented not under the perspective of being final, but aiming to motivate future investigations on this complex and challenging subject of dealing with the universe of knowledge for retrieving purposes, a polemic subject  but of   increasing importance in the electronic era.
Keywords: Classification; Internet; Knowledge Representation; Registered Knowledge; Information Retrieval.

 
LANGRIDGE (1) em sua obra Classificação - uma abordagem para estudantes de biblioteconomia, afirma que "sem classificação não poderia haver nenhum pensamento humano, ação e organização que conhecemos. A classificação transforma impressões   sensoriais, isoladas e incoerentes em  objetos reconhecíveis e padrões recorríveis".
 O fato de que não nos darmos conta do quanto classificamos em nosso dia a dia, é o  reconhecimento deste processo como fundamental da natureza  humana: o homem, em todas as  suas atividades diárias, naturalmente classifica, o que não será diferente quando estamos lidando com a Internet.
Antes de iniciarmos a discussão propriamente dita sobre a  classificação como interface da Internet, cumpre-nos entender o universo Internet sob a nossa perpectiva. Para tal  vamos nos valer das três perguntas colocadas por  FLORIDI (2) : O que é precisamente a Internet? Para que a Internet pode ser usada?.  Quais serão os efeitos de tal revolução radical  na maneira de lidar com o mundo de informação? Para nossos objetivos, esta última pergunta será direcionada  para o Como lidar com este mundo de informação para fins de recuperação?  - pois,  é aqui que entendemos a habilidade e a competência  que   caracterizam e justificam a Classificação como uma    interface natural e necessária da  Internet.
 A Internet pode ser definida como a Rede das Redes ou como uma Rede  Interativa de Redes, agregando serviços e recursos interativos,  sem que possa ser  fisicamente visualizada ou localizada  em termos de espaço  e  tempo. É precisamente  isto que a difere de um Sistema de Recuperação da Informação tradicional  . Mas, será que a Internet deixa de ser um Sistema quando consideramos que    um   sistema compreende     um conjunto de componentes, que apresentam uma estrutura organizada, havendo entre eles um relacionamento tal que permita ao sistema alcançar os objetivos  propostos  para ele?. Parece que não . Portanto,  é sob esta ótica que iremos focar a Internet.
Há diferenças fundamentais entre o ambiente  tradicional   e o ambiente eletrônico de sistemas de informação  que precisam ser mencionadas para que fiquem claros os questionamentos sobre os processos  de tratamento da informação em função de recuperação  para fins específicos nestes dois ambientes.  Essas diferenças serão aqui analisadas em função dos dois elementos considerados como referenciais fundamentais  de qualquer Sistema de Recuperação de Informação : os Documentos e os Usuários ou seja: O QUE em temos de informação e PARA QUEM .
Nos sistemas tradicionais,   um conjunto de documentos é  selecionado em função dos objetivos próprios de cada sistema, em função  da(s) área (s) do conhecimento em que atua  e da caracterização do tipo  de usuário a que serve e, muitas vezes, por tipo de documento.
 Em princípio, a Internet não seleciona nenhum tipo de documento, abrange todas as  áreas  do conhecimento e caracteriza  como sendo seus usuários todas as pessoas que a acessam, independentemente de sua caracterização em  " tipo de usuário".
Nos sistemas tradicionais, ao longo do tempo foram desenvolvidos instrumentos de organização do conhecimento  com a finalidade de arranjo físico e arquivamento  e, métodos e técnicas  de representação da informação com a finalidade de descrever o conteúdo intelectual dos documentos para fim de  recuperação por assunto . Nestas  duas atividades   a Classificação exerce o papel fundamental de organizar e representar e , com os mesmos objetivos, quer no ambiente tradicional  quanto no ambiente eletrônico.
A   organização do conhecimento  por si só já é reconhecida como um campo autônomo de conhecimento.  Como bem aponta DAHLBERG (3), a necessidade de organizar o conhecimento   sempre foi reconhecida. Durante muito tempo este interesse foi terreno quase que exclusivo de Bibliotecários e Filósofos. Mais tarde passou a ser também área de interesse dos Autores de Enciclopédias e Educadores, seguidos pelos   Documentalistas, Cientistas da Informação e Linguistas .  Mais recentemente, profissionais das áreas de Inteligência Artificial, Produtores de Sistemas Especialistas e de Sistemas Hipermídia passaram a fazer parte do elenco de estudiosos desta área. Hoje em dia  certamente podemos incluir a  Internet como foco de interesse em questões de organização do conhecimento e representação da .informação com o objetivo primordial  de usufruir ao máximo as vantagens  de acesso ao conhecimento registrado.
A constatação de que um mesmo campo desperte o interesse de investigação  para finalidades intelectuais e  de ordem prática   em lidar com o conhecimento por profissionais  de diferentes áreas  , nos faz especular em torno de um  elemento básico, integrador desses interesses: a Classificação .Como ilustração  podemos citar a máxima do filósofo americano John Dewey :  "Conhecimento é Classificação" o que segundo LANGRIDGE (4) essa pode não ser uma definição precisa do conhecimento, mas enfatiza como efetivamente  significativo o papel da Classificação.
Como já mencionado, nos tempos mais antigos, os Bibliotecários foram os principais responsáveis em ordenar o conhecimento registrado   para fins de guarda, arquivamento, recuperação e acesso. Na verdade, estas necessidades  básicas dos sistemas tradicionais de informação são as mesmas que se apresentam  na Internet.

Como sabemos, o aumento exponencial da literatura por um lado e a diversidade de  demandas de informação por outro, incentivou e, até mesmo, provocou ao longo do tempo o desenvolvimento de estudos e pesquisas no campo da organização do conhecimento e da representação da informação. Instrumentos, métodos e técnicas de tratamento da informação se proliferaram. Atualmente, com a introdução das novas tecnologias de comunicação e  informação, o  problema do tratamento da informação,  em sua essência continua o mesmo. O que  passa a ser diferente são as  novas dimensões das atividades coleta, arquivamento, busca e acesso à informação/conhecimento.  Continuam  a ter especial interesse o desenvolvimento de instrumentos métodos e técnicas  direcionadas a solucionar os aspectos cognitivos , operacionais e  práticos de tratamento da informação.
 A evolução histórica dos instrumentos de organização do conhecimento teve momentos marcantes, caracterizados por diferentes metodologias de construção e diferentes técnicas  e métodos de indexação por assunto.  Cada etapa foi marcada por uma nova abordagem visando  sanar as deficiências de sua antecessora em lidar com o conhecimento registrado para fins de organização e  recuperação, principalmente em função da  demanda de itens específicos e precisos.
Os esquemas de classificação bibliográfica começaram sendo gerais, ou seja,  abrangendo todas as áreas do conhecimento. Os primeiros foram enumerativos (ex. Classificação Decimal de Dewey - CDD) , os que se seguiram foram semi-enumerativos ou semi-facetados (ex. Classificação Decimal Universal  - CDU). A geração seguinte foi  a dos esquemas analítico-sintéticos ou facetados (ex. Classificação de Dois Pontos - CC). Numa etapa posterior, graças a teoria que norteou as classificações facetadas, começaram a ser elaborados esquemas  por área do conhecimento. Importante observarmos que a passagem dos esquemas  enumerativos para facetados teve como objetivo obter flexibilidade e especificidade  de classificação de  assuntos.
Os sistemas de indexação também  tiveram uma evolução significativa. Ao longo do tempo foram se tornando cada vez mais sofisticados e complexos na tentativa de melhor representar o conteúdo intelectual dos documentos para fins de recuperação frente a necessidades cada vez mais  complexas e  diversificadas de  recuperação de informação.
Como nos apresenta AUSTIN, (5), os primeiros sistemas  nomeavam os  assuntos (listas de cabeçalhos de assunto). Os sistemas  subsequentes  optaram por  fracionar o cabeçalho de assunto em  seus itens constitutivos para permitir maior  flexibilidade de busca  (sistemas unitermos) .No entanto esta partição apresentou o problema sério decorrente da descontextualização. Na  tentativa de recuperar esta perda,  diferentes mecanismos  de reagrupamento foram desenvolvidos usando artifícios de diferentes naturezas para garantir maior significação  na representação dos assuntos (ex. sistemas relacionais , articulados e o  sistema PRECIS - Preserved Context Indexing System) . Surgem também os Tesauros , os Tesauros Facetados e outras modalidades de tesauros, como por exemplo os Classaurus (6)   como linguagens representacionais de busca, visando  cada vez mais  a obtenção de contextualização e  especificidade controladas.

 WEINBERG (7) apresenta na reunião  anual da ASIS em 1996 um interessante artigo  no qual  discute  sobre a crescente complexidade dos sistemas de organização do conhecimento e  representação da informação - aí incluídos os esquemas de classificação e os sistemas de indexação de assuntos. Apresenta  possíveis razões para fracassos e abandonos , trazendo a discussão para as implicações na organização da Internet.
O periódico Library Trends publicou em  1998 um número especial  editado por BOWKER & STAR (8)   no qual aponta problemas e desafios  da classificação na era eletrônica.
No aspecto técnico da representação da informação, mais especificamente da descrição dos itens de informação,  a OCLC (Online Computer Library Center) tem liderado as pesquisas sobre este tema. Como sabemos, a OCLC também vem trabalhando no desenvolvimento de um conjunto de meta-dados representacionais para busca de documentos  na Internet - conhecimento como Dublin Core (9). Cumpre ressaltar também  as seguintes contribuições: HSIEH-YEE (10 ) propõe modificações na prática da catalogação  visando uma organização mais efetiva dos recursos da Internet. OLSON (11) edita um Manual e um guia prático para a catalogação de recursos na Internet. TAYLOR & CLEMSON (12) questionam soluções para o acesso aos documentos da rede: indagam se Catálogos? Robôs de Busca? ou ambos? .
Todos  estes exemplos são propostas sobre as quais ainda não podemos nos pronunciar quando a sua eficiência naquilo a que se propõem no contexto da Internet.   No entanto, é  importante ressaltar  que   a discussão sobre o assunto já começou. Além disso:  considerando  a Internet, com suas  propriedades como  rede interativa de informações e com as características de seus componentes fundamentais enquanto documentos que veicula e usuários que a acessam, certamente há ainda muito o que pesquisar sobre a sua Interface com a Classificação  - a atividade básica que permeia todas as preocupações acima apontadas.
Tendo apresentado a importância da Classificação no processo de tratamento da informação, vamos  nos deter no  conceito de Interface. No Dicionário da Língua Portuguesa de FERREIRA (13) , a palavra Interface é definida no  contexto da Física, como: "superfície de separação entre a atmosfera e o mar, ou entre duas camadas de água de diferentes propriedades". Na Enciclopédia e Dicionário Ilustrado de KOOGAN/HOUAISS (14) Interface é definida como a "superfície que forma um limite comum entre dois corpos, espaços ou fases./ Lugar em que dois sistemas independentes se encontram, interatuam ou se intercomunicam" . Essas  definições de Interface  trazem importantes considerações para o   nosso contexto de discussão.
Quando falamos da Interface Internet-Classificação realmente estamos falando da sutileza da superfície de separação entre a atmosfera - a Classificação, e o Mar -a  Internet, ou entre  dois elementos de diferentes propriedades - a informação e os usuários . Estamos também falando da superfície que forma um limite comum entre dois espaços - o espaço informação enquanto Internet, e o espaço organização e representação do conhecimento enquanto classificação. Estamos falando do lugar onde  dois sistemas independentes se encontram, interatuam ou se  intercomunicam.

Como considerações finais   podemos dizer que no atendimento às necessidades de informação dos usuários/clientes da Internet,    a atividade  de Classificação  se faz presente nas mesmas duas principais funções de um sistema  tradicional de recuperação de  informação:  na habilidade para identificar itens de informação específicos e definidos de forma precisa (sistemas de indexação de assuntos) e na habilidade de demonstrar as áreas de assunto disponíveis (estruturas  classificatórias /instrumentos de classificação)
Consideramos também que as experiências no campo da  classificação, no contexto do organização do conhecimento e da representação da informação para fins de recuperação,   não devem ser desprezadas. Estas contribuições poderão ser de grande valia na busca de melhores soluções  operacionais e de ordem prática para o tratamento da informação na era eletrônica, particularmente em se tratando da  Internet.
No entanto, consideramos que  frente a complexidade da questão, deva haver uma    reflexão mais consciente  sobre os aspectos cognitivos do problema,  voltando às origens do processo de classificação  que está essencialmente na base  de como o ser humano aprende.
Para concluir e no sentido de estimular questionamentos e pesquisas futuras  ressaltamos que a Classificação é uma   Interface insubstituível da Internet. Resta aos interessados  especular e explorar como desenvolver de forma mais efetiva a Interface Classificação-Internet para que cada internauta saiba como melhor usufruir  das vantagens oferecidas por esta inigualável rede interativa de redes  de  informação.  Ou melhor dizendo, para  que  os internautas possam navegar ou surfar no mar aberto da Internet  sem perder o rumo, guiados pela bússola  da Classificação.

 
Referências:

[1]  LANGRIDGE, D. Classificação - abordagem para estudantes de biblioteconomia. Trad. de Rosali P.Fernandez .  Rio de Janeiro, Interciência, 1977. p.11

[2] FLORIDI, L. The Internet:which future for organised knowledge, Frankenstein or Pygmalion? Part 1.  The Electronic Library, vol.14, No. 1, February 1996. p.

[3]  DAHLBERG, I. Knowledge organisation: its scope and possibilities.Knowledge Organisation vol.20, No.4. 1978. p. 211.

[4]  LANGRIDGE, D opus cit (1) p.11

[5] AUSTIN, D. Two steps forward. In. Palmer,B.I.   Itself an education: six lectures on classification. London, The Libray Association, 1971. p.69-110.

[6] FUGMAN, R. An interactive classaurus on PC. International Classification, vol. 17. No.3/4, 1990. P. 133-13

[7] WEINBERG, B.H. Complexity in indexing systems - abandonment and failure: implications for organizing the Internet.  1996 Meeting of the American Society for Information Science  (ASIS)

[8] BOWKER, G.C. & STAR, S.L. How classifications work: problems and challenges in an electronic age. Library Trends, vol. 47, No.2 .Fall 1998. p. 185-340.

[9] METADATA: the foundations of resource description. Dlib Magazine July1995
       http://www.dlib.org

[10] HSIEH-WEE, I.  Modifying cataloging practice and OCLC infrastructure for effective organization of Internet resources.
       http://www.oclc.org/oclc/man/colloq/hsieh.htm

[11] OLSON, N.B.ed. Cataloging Internet Resources.
       http://www.oclc.org/oclc/man9256cat/toc.htm

[12] TAYLOR, A.G. & CLEMSON, P. Access to networked documents: catalogs search engines? both?
       http://www.oclc.org/oclc/man/colloq/taylor.htm

[13] FERREIRA, A,B.de H. Novo dicionário da língua portuguesa. Rio de Janeiro,  Nova Fronteira, [s.d.] p. 775.

[14] KOOGAN/HOUAISS. Enciclopédia e dicionário ilustrado. Rio de Janeiro, Ed. Delta, 1993. p. 473.
 
Sobre o autor / About the Author:
    Rosali Fernandez de Souza
    PhD, Pesquisadora Titular do IBICT
    Professora do PPGCI do Convênio CNPq/IBICT-UFRJ-ECO