
Sobre o Projeto
Inferência de entidades e propriedades para arquivos semânticos
O Arquivo Nacional da Torre do Tombo, TT a seguir, é a espinha dorsal da memória nacional portuguesa, gerida pela DGLAB, o parceiro do EPISA na administração pública. O arquivo tem a coleção de património cultural mais relevante, largamente digitalizada e acedida tanto por investigadores de História como por leigos dos países de língua portuguesa e de outras. O vasto volume de metadados de descrição arquivística ajudam-nos a encontrar e contextualizar os documentos que procuram. Na dianteira do mundo dos arquivos, a TT definiu o seu próprio sistema de descrição online há 20 anos, seguindo as normas do Conselho Internacional de Arquivos (ICA). Os metadados na TT são na maior parte descrições textuais do contexto e conteúdo de documentos. Entretanto os objetos de arquivo evoluíram para incluir cada vez mais informação nascida digital e os requisitos de interoperabilidade em repositórios de património cresceram. É necessária uma nova geração de ferramentas de descrição que inclua bibliotecas, arquivos e museus, com um grão mais fino , mais flexível e especialmente mais facilmente processável por máquinas. Estas são as caraterísticas dos dados abertos ligados (LOD) nas redes semânticas e o trabalho preliminar da TT neste domínio levou a escolher o CIDOC Conceptual Reference Model (CRM)(ISO, 2014), uma norma desenvolvida pela comunidade dos museus.
O modelo concetual do CIDOC CRM é um grafo onde os nós são entidades e as arestas são relações. O grande passo representado por esta mudança de paradigma levanta várias questões, algumas das quais este projeto se dedica a resolver. O primeiro problema é a migração efetiva entre as normas ICA e as do CIDOC CRM, que usa tanto os modelos de tradução existentes como a inferência das novas relações com métodos semi-automatizados. O segundo problema é o suporte à descrição, com ferramentas que automatizam parte da geração dos registos de metadados mais complexos do CIDOC CRM. O terceiro tem a ver com interfaces para utilizadores humanos e máquinas, melhorando o acesso dos utilizadores aos arquivos e promovendo a interoperabilidade tanto com arquivos como com redes semânticas globais.
O papel da TT como grande instituição de arquivos (reúne a sede em Lisboa e a maioria dos arquivos distritais) e como regulador para arquivos do estado, municipais e privados, garante o impacto dos resultados do projeto se a mudança de paradigma se efetuar. O extenso registo de inovação da TT torna-a uma voz respeitada na discussão em curso sobre a evolução dos arquivos.
Esperam-se três impactos principais do projeto. A alteração proposta nos metadados do património cultural dará aos utilizadores um maior conhecimento do repositório e melhores ferramentas para a pesquisa. O segundo impacto é a presença nos agregadores, especialmente a Europeana, que já usa uma abordagem semelhante na descrição. O terceiro é o potencial para lidar com metadados em diferentes plataformas, de ficheiros Excel a sistemas de descrição arquivística, assim contribuindo para a integração de recursos administrativos e de investigação no Arquivo Digital da Administração Pública.
Acrónimo
EPISA
Responsável
Carla Alexandra Teixeira Lopes
Estado
Concluído
Início
January 1, 2019
Fim
January 31, 2022
Data efectiva de fim
January 31, 2022
Orçamento Global
299 237,50 €
Financiamento
251 175,00 €
Equipa
Disseminações
INESC TEC tem um modelo de gestão único e diferenciador, aprimorado ao longo de mais de 35 anos de história. Refletindo a sua posição única entre a academia e a indústria, o gestão no INESC TEC cuidadosamente equilibra, num modelo híbrido, a cultura académica de liberdade científica e diálogo com uma cultura de eficiência e responsabilidade em gestão.