A NVIDIA apresentou a plataforma Rubin, composta por seis chips que conseguem formar um supercomputador dedicado a inteligência artificial. O sistema traz avanços em desempenho, segurança e redução de custos com tecnologias como NVLink e Transformer Engine.
Rubin é projetada para acelerar tarefas de IA complexas, como raciocínio avançado e inferência em larga escala, utilizando modelos chamados MoE. Com essa plataforma, o treinamento requer até quatro vezes menos GPUs e o custo por token cai até dez vezes em relação à geração anterior.
Grandes empresas de tecnologia e provedores de nuvem, como AWS, Google e Microsoft, planejam adotar Rubin. A plataforma terá produtos disponíveis a partir do segundo semestre de 2026, incluindo a CPU Vera Rubin, que promete melhorar o desempenho e a eficiência energética de sistemas de IA generativa.
A NVIDIA Rubin é a nova plataforma da NVIDIA composta por seis chips desenvolvidos para formar um supercomputador dedicado à inteligência artificial. A empresa destaca que o sistema oferece avanços em desempenho e segurança, além de reduzir custos, com inovações como as tecnologias NVLink, Transformer Engine, Confidential Computing, RAS Engine e a CPU Vera.
Essa plataforma visa acelerar tarefas de IA, incluindo raciocínio avançado e inferência em larga escala, usando modelos especializados chamados MoE (mistura de especialistas). Segundo a NVIDIA, Rubin treina esses modelos com até quatro vezes menos GPUs, reduzindo custos por token em até dez vezes em comparação com a geração anterior, a plataforma Blackwell.
O ecossistema Rubin contempla parcerias com grandes laboratórios, provedores de nuvem e fabricantes, como AWS, Google, Microsoft, Meta e Dell, que planejam adotar a plataforma. A infraestrutura inclui a NVIDIA Inference Context Memory Storage, que expande o contexto de inferência, e a tecnologia BlueField-4, que promove compartilhamento eficiente de dados com menor consumo de energia.
Além disso, Rubin traz a placa-mãe HGX Rubin NVL8, capaz de interligar oito GPUs via NVLink para suportar sistemas de IA generativa baseados em arquitetura x86. A solução de rede Spectrum-6 Ethernet oferece comunicação otimizada para expansões em fábricas de IA, apresentando maior confiabilidade e eficiência energética.
Os produtos da plataforma NVIDIA Rubin começarão a ser disponibilizados no segundo semestre de 2026, com grandes provedores de nuvem já programados para lançar instâncias baseadas na nova CPU Vera Rubin.
Via TI Inside