USP Lança Maior Cluster de IA da América Latina com 96 GPUs Blackwell

A Universidade de São Paulo (USP) inaugurou o supercomputador Jairu, um marco significativo para a pesquisa científica e tecnológica no Brasil e na América Latina. Este novo sistema é reconhecido como o maior cluster de inteligência artificial em operação na região, sendo equipado com 96 unidades das mais recentes GPUs NVIDIA Blackwell B200 SXM-5.
A infraestrutura de ponta foi instalada na Cidade Universitária, em São Paulo, e será gerida pelo Centro de Inteligência Artificial e Aprendizado de Máquina (CIAAM-USP). O projeto, que representa um investimento total de R$ 40 milhões, visa ampliar drasticamente a capacidade da universidade para desenvolver grandes modelos de inteligência artificial, como LLMs, e conduzir pesquisas avançadas em diversas áreas do conhecimento.
Arquitetura e Potência do Supercomputador Jairu
O cluster Jairu foi projetado sob o conceito de IA Factory, um modelo que prevê ambientes escaláveis e otimizados para cargas intensivas de inteligência artificial, aprendizado de máquina e computação científica acelerada por GPU (HPC). A espinha dorsal computacional do sistema é composta por 12 nós de computação no padrão HGX-8x B200.
Cada um desses 12 nós integra oito GPUs NVIDIA Blackwell B200 SXM-5, totalizando as 96 unidades. Um detalhe crucial da arquitetura é a interconexão entre essas placas de processamento gráfico: elas são ligadas por NVLink, o que permite um compartilhamento de memória de alta largura de banda dentro do nó, essencial para o treinamento distribuído de modelos de grande porte.
Componentes de Suporte e Conectividade
Para garantir o fluxo contínuo de dados e a baixa latência, o Jairu conta com uma infraestrutura de rede robusta e armazenamento de alta velocidade:
- Head Nodes: Cinco nós dedicados ao gerenciamento e orquestração do ambiente, equipados com processadores AMD EPYC e conectividade InfiniBand NDR de 400 Gb/s.
- Armazenamento: Um sistema paralelo BeeGFS que oferece aproximadamente 300 TB úteis, suportado por um servidor dedicado e unidades NVMe de alta densidade.
- Rede de Alta Performance: Infraestrutura com capacidade de até 200 Gb/s em Ethernet e até 800 Gb/s em InfiniBand NDR, assegurando escalabilidade horizontal e comunicação eficiente entre os nós.
A arquitetura Blackwell foi especificamente desenvolvida pela NVIDIA para IA generativa e HPC, prometendo um salto de performance em relação à geração anterior, Hopper, especialmente no treinamento de modelos com trilhões de parâmetros.
Veja também:
Parcerias e Implementação
A concretização do projeto foi resultado de uma colaboração estratégica entre três empresas brasileiras e a gigante de tecnologia NVIDIA. A aquisição foi realizada por meio de importação direta dos Estados Unidos, após um processo de concorrência pública vencido pelo consórcio.
Envolvimento das Empresas
O sucesso da implantação se deve à sinergia entre os parceiros:
- Scherm Brasil: Responsável pela integração, implantação do sistema e liderança da importação.
- Positivo Servers & Solutions: Concessionária oficial da Supermicro no Brasil, forneceu os superservidores que estruturam o cluster, destacando a fabricação nacional de soluções de TI.
- NVIDIA: Fornecedora da tecnologia de processamento central, as GPUs Blackwell B200.
O investimento totalizou R$ 40 milhões, e a montagem física do complexo foi notavelmente rápida, sendo concluída em apenas 30 dias após a assinatura do contrato.
Impacto na Pesquisa Brasileira
Com o supercomputador Jairu em operação, a USP eleva seu patamar em pesquisa de ponta. O cluster permitirá que pesquisadores treinem modelos de IA mais complexos e realizem simulações científicas que antes eram inviáveis devido às limitações de poder computacional.
O CIAAM-USP enfatiza que a nova infraestrutura posiciona o Brasil de forma mais competitiva no cenário global de supercomputação. A adoção da suíte de software NVIDIA AI Enterprise e do NVIDIA Base Command Manager facilita o gerenciamento centralizado, o controle de filas e o isolamento de usuários, garantindo a reprodutibilidade dos experimentos científicos.
O coordenador do CIAAM-USP, Fábio Cozman, ressaltou que o Jairu permitirá o desenvolvimento de grandes modelos e o aprofundamento de pesquisas relevantes para o contexto brasileiro. A infraestrutura está apta a suportar desde a ciência de dados e o processamento massivo de informações até o desenvolvimento de aplicações em visão computacional e processamento seguro de algoritmos complexos.
