'Empresas e organizações estão descobrindo a necessidade da taxonomia', diz Heather Hedden
Carlos Eduardo Entini - Estadão Acervo
03/12/2020 | 11h31   
Autora do livro The Accidental Taxonomist contou ao Estadão Acervo os novos usos da técnica no meio digital
Taxonomia, a velha arte de classificar e organizar a informação, está tão presente na nossa vida digital como o ar que nos rodeia. Ela saiu do campo restrito de alguns áreas do conhecimento (biologia, ciência da informação) para ser uma prática diária presente em quase todas as ações na esfera digital. Consciente ou não, praticamos a antiga técnica de classificar informação ao colocar uma hashtag numa postagem em qualquer rede social. Portanto, caso você não saiba, você é um taxonomista. Se não fosse assim, a sua mensagem seria apenas uma garrafa boiando sem destino no mar das informações.
A taxonomia é também essencial para a inteligência artificial - que não teria o “inteligente” se não tivesse os dados alimentados e organizados por nós – e para organização dos ativos digitais das empresas. Sejam elas de qualquer tamanho, explica Heather Hedden, autora do livro Taxonomista Acidental (The Accidental Taxonomist). Segundo ela, em entrevista ao Acervo Estadão, “empresas de todos os tipos, com grandes bases de conhecimento, estão usando taxonomia para gerenciar e recuperar seu conteúdo interno para compartilhamento e colaboração”.
Apesar da taxonomia ser uma atividade mais praticada por alguns profissionais como da tecnologia da informação e bibliotecários, ela tende a cada vez mais a fazer parte, como mostra Hedden, das atividades chaves das organizações. Por isso seu livro é importante, pois Hedden aborda de forma didática todas as etapas da criação de um projeto de taxonomia, desde a criação de um vocabulário controlado até a escolha dos programas. O livro não tem tradução para o português, mas pode ser encontrado facilmente em versão eletrônica. O trabalho de Hadden também pode ser acompanhado em seu blog.
Você poderia nos falar sobre os novos usos da taxonomia?
As taxonomias têm muitos usos. A novidade é que todos os tipos de empresas e organizações de todos os tamanhos estão descobrindo a necessidade de taxonomias para gerenciar seus documentos eletrônicos internos, sistemas de gerenciamento de conteúdo ou SharePoint e em seus sites externos. É novo que as empresas menores estão vendo a necessidade de taxonomia. A análise de dados, como a análise de sentimentos, também é um uso novo para a taxonomia.
Além da academia e bibliotecas, quais áreas do conhecimento e negócios estão usando a taxonomia?
A taxonomia é usada por todos os tipos de editoras, agora que eles criam cada vez mais conteúdo. A taxonomia facilita o gerenciamento e a reutilização de conteúdo digital. A taxonomia também foi adotada por outras empresas com muito conteúdo digital, como produtores de mídia e agências de publicidade para gerenciar seus ativos digitais. As agências governamentais também usarão taxonomia porque eles têm muita informação pública. Taxonomia dos produtos também é usada no comércio eletrônico, atualmente todos os tipos de varejistas on-line têm taxonomia. Empresas de todos os tipos, com grandes bases de conhecimento, estão usando taxonomia para gerenciar e recuperar seu conteúdo interno para compartilhamento e colaboração.
Como a taxonomia é aplicada no machine learning e na inteligência artificial?
A aplicação da taxonomia se dá pela indexação ou classificação do conteúdo. Isso pode ser feito manualmente ou automatizado. A indexação automatizada, também chamada de categorização automática ou classificação automática, geralmente compõe o aprendizado da máquina ou tecnologias de Inteligência Artificial focadas na análise de texto. Este é um campo de interesse crescente. O aprendizado de máquina envolve o aprendizado do software de categorização automática para indexar a partir de exemplos de conteúdo semelhante indexado corretamente com os termos de taxonomia. Outro método de categorização automática envolve ter regras para a indexação
A taxonomia é fundamental para o machine learning?
Existem diferentes aplicações de aprendizado de máquina e nem todas precisam envolver uma taxonomia. Se o objetivo é a indexação automatizada, o uso de uma taxonomia é fortemente recomendado para melhores resultados.
Como os usuários da internet são importantes para a criação de um vocabulário controlado e dos termos? Os usuários estão mudando ou influenciando a taxonomia, isto é, como termos criados por eles são incorporados pelos sistemas?
Em geral, os usuários de uma taxonomia são um fator importante para projetar e criar um vocabulário, porque uma taxonomia deve ser personalizada para o conteúdo e aos usuários desse conteúdo. Questionários, pesquisas ou entrevistas com usuários, fazendo perguntas sobre suas necessidades e problemas ao pesquisar ou gerenciar conteúdo, são métodos importantes para criar uma taxonomia. Em alguns casos, os usuários podem já estar etiquetando conteúdo com suas próprias palavras-chave, e elas podem ser avaliadas para inclusão na taxonomia.
Pela sua experiência, quais são os principais desafios e dificuldades da taxonomia?
Para projetar e criar uma taxonomia adequada a uma situação específica, o processo precisa ser um esforço colaborativo. É necessário haver colaboração entre o conhecimento e a experiência de taxonomistas, profissionais com experiência do usuário, arquitetos da informação, tecnólogos da informação, gerentes de conhecimento, gerentes de conteúdo, arquitetos de metadados, analistas de negócios, gerentes de projeto, especialistas no assunto etc. Não é incomum, então, haver discordâncias ocasionais entre essas pessoas em diferentes papéis. Portanto, o desafio é chegar a um acordo nesses casos. Por exemplo, pode haver discordância quanto ao número de conjuntos de hierarquias de taxonomia.
Que dicas você daria para quem pensa em iniciar um projeto de taxonomia?
Ao iniciar um projeto de taxonomia, é importante definir o escopo da taxonomia e para qual conteúdo ele será usado. Pode ser usado para uma única coleção de documentos digitais, conteúdo variado de pesquisa, todo conteúdo da intranet ou mesmo conteúdo da intranet e do site público. A taxonomia deve ser projetada para refletir o conteúdo no escopo. Relacionado ao escopo, está a identificação da propriedade e da responsabilidade a longo prazo pela taxonomia. As organizações não têm um departamento de taxonomia. Organizações diferentes gerenciam taxonomias em departamentos diferentes, portanto, pode não ser claro quem deve ter responsabilidade e pode ser uma responsabilidade compartilhada.
Também é importante considerar como a taxonomia será aplicada ou marcada ao conteúdo. Pode ser automatizado ou manual. Se automatizado, é necessário tomar uma decisão sobre qual software de codificação automática comprar. Se for manual, é necessário considerar quem fará a marcação, como eles serão treinados e como a taxonomia e a interface com o usuário da marcação serão fáceis de usar. Assim, uma consideração relacionada é a tecnologia. Se o software para marcação, gerenciamento de conteúdo e recuperação já estiver em vigor, ele poderá conter limitações ou restrições no projeto da taxonomia. Se o software ainda não foi selecionado, os requisitos de taxonomia devem ser levados em consideração. COLABOROU BEATRIZ HELENA SILVA
Comentários
Os comentários são exclusivos para assinantes do Estadão.