Dissertação: "O Data Catalog Vocabulary (DCAT) para a publicação de dados de pesquisa nos princípios Linked Data"

Autor: Kazumi Tomoyose

Mestrado em Ciência da Informação pelo Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de São Carlos (UFSCar)

Disponível em: https://repositorio.ufscar.br/handle/ufscar/14116

Com o desenvolvimento das tecnologias semânticas, cresce a importância e o reconhecimento dos dados como fontes informacionais. Nesse contexto, os dados gerados a partir de pesquisas são cada vez mais valorizados, uma vez que sua publicação permite a fundamentação dos resultados obtidos com os trabalhos científicos, além de auxiliarem na produção de novos conhecimentos de forma sustentável. Assim, é observada a necessidade em organizar esses dados de pesquisa, de forma a otimizar a recuperação deles, sendo que poderiam ser utilizados, para tal finalidade, os vocabulários. Os vocabulários são compreendidos como conjuntos de termos que padronizam a descrição de recursos, sendo o foco da presente pesquisa aqueles voltados à padronização dos elementos de metadados, pensando-se na organização e recuperação da informação. Ao considerar o ambiente da Web, a utilização dos princípios Linked Data melhora a descoberta de novos dados, sendo que o Data Catalog Vocabulary (DCAT) figura como um vocabulário voltado à descrição de catálogos e seus conjuntos de dados, buscando favorecer a interoperabilidade na Web. O objetivo da pesquisa consiste em analisar as características e os fundamentos do DCAT e dos vocabulários adotados por ele para a publicação de dados de pesquisa nos princípios Linked Data, de modo a identificar a discussão sobre a temática na literatura e verificar a utilização do mesmo. Por meio de pesquisa exploratória, descritiva e teórica, foi possível sistematizar e analisar as características dos vocabulários, identificando-se que o DCAT permite que os catálogos e os conjuntos de dados sejam padronizados, diminuindo questões de ambiguidade e proporcionando a descoberta de dados e de serviços de dados, uma vez que dispõe termos específicos para tal finalidade. Desse modo, alinhado também aos princípios Linked Data, o uso do DCAT permite que sejam efetivados os benefícios do compartilhamento dos dados de pesquisa. Foi realizada também a análise de plataformas do re3data a fim de identificar a atual utilização do vocabulário por elas, verificando-se baixa adoção do DCAT. Entretanto, os resultados indicam a preocupação dessas plataformas com questões de encontrabilidade, acessibilidade, interoperabilidade e reutilização, indo de encontro com os princípios Linked Data e os princípios FAIR. A pesquisa revelou que existem poucas discussões sobre o DCAT na literatura, em especial no âmbito da Ciência da Informação. Dessa forma, identifica-se a necessidade de melhor explorar as possibilidades de representação da informação no contexto dos dados de pesquisa. Além disso, maiores discussões que alinhem o conhecimento da área às ferramentas e aos conceitos semânticos aplicados à Web potencializam os benefícios de encontrabilidade, utilização e recuperação de informações, além de expandir e aprimorar os conhecimentos e as possibilidades de atuação dos profissionais da informação.