Research Computing & Data Infrastructure
Sobre
Infraestrutura computacional e de dados partilhada para suporte à investigação científica
A Infraestrutura de Computação e Dados para Investigação do INESC TEC suporta as atividades de I&D da instituição, disponibilizando um conjunto diversificado de plataformas para responder a um amplo espectro de necessidades de investigação, desde computação científica de uso geral e ambientes virtualizados até cargas de trabalho aceleradas por GPU e investigação em sistemas bare-metal.
Localização: Sede do INESC TEC (datacenter) e Universidade do Minho (CLOUDinha)
Onde atuamos
A computação avançada tem um papel central em áreas tão diversas como a saúde, a indústria, a educação, os transportes, a inteligência artificial ou a cibersegurança. A atual transformação digital impõe novos desafios à investigação e à inovação, exigindo infraestruturas tecnológicas robustas e adaptáveis. Neste contexto, a nossa infraestrutura tem sido essencial para o desenvolvimento de tecnologias que respondem a essas exigências, apoiando investigação transversalmente em múltiplas áreas no INESC TEC.
O que oferecemos
A nossa infraestrutura disponibiliza serviços para diversas atividades de I&D. Entre os exemplos de utilização, destacam-se:

Ambientes de computação bare-metal e virtualizados

Computação acelerada por GPU para treino e inferência de modelos de IA
Armazenamento de objetos de alta capacidade (compatível com S3)
Plataforma MLOps para fluxos de trabalho de machine learning e desenvolvimento e disponibilização de LLMs
Aprovisionamento de máquinas virtuais via portal self-service

Memória persistente e hardware confiável

Placas de rede programáveis

Processamento de dados em larga escala para energia, saúde e indústria
Suporte computacional a simulações, bioinformática e visão por computador
Equipamentos
Foi através do nosso apoio a nível computacional que muitos investigadores atingiram a excelência nos seus trabalhos académicos, traduzindo a capacidade do nosso equipamento num esforço de milhares de horas de computação. Atualmente, a infraestrutura inclui:
Cluster CCloud: aproximadamente 3.400 cores físicos de CPU, 31,5 TB de RAM e 74 GPUs, interligados por redes de 25/100 Gbit/s. As GPUs incluem modelos NVIDIA L40S, H200 e RTX 6000 Pro, sendo 45 com capacidade para LLMs. Um portal self-service permite aos utilizadores designados de cada Centro aprovisionar máquinas virtuais a pedido.
300 TB de armazenamento convencional em bloco e ficheiro para discos de máquinas virtuais e cargas de trabalho persistentes.
2,8 PB de armazenamento de objetos de alto débito compatível com S3 (dois clusters), construído internamente com software open-source e hardware de classe empresarial sobre uma rede Ethernet de 100 Gbit/s.
Protótipos
A infraestrutura fornece a capacidade computacional necessária para desenvolver, otimizar e testar software no âmbito de várias linhas de investigação, disponibilizando anualmente milhares de horas de computação. Entre as atividades suportadas incluem-se o desenvolvimento de protótipos e serviços, a execução de simulações, e o treino e disponibilização de modelos de machine learning e LLMs. Entre os protótipos desenvolvidos com o apoio da infraestrutura CLOUDinha, destacam-se os seguintes:

LazyFS: ferramenta para avaliar propriedades de durabilidade de dados em aplicações críticas (p.e., bases de dados)

PAIO: ferramenta que permite criar otimizações de armazenamento programáveis e adaptáveis



