Voltar para o blog
Pesquisa Acadêmica

QuietBox 2: A Estação de Trabalho para IA que Cabe no Seu Escritório e Supera PCs Convencionais

24 de março de 2026
14:13
Hardware para IAestações de trabalho IAmemória GDDR6modelos de linguagem grande porteTenstorrent QuietBox 2aceleradores Blackholememória DDR5Ubuntu para IAopen source IANvidia DGX Station
QuietBox 2: A Estação de Trabalho para IA que Cabe no Seu Escritório e Supera PCs Convencionais

Com o crescimento da inteligência artificial generativa, a demanda por estações de trabalho capazes de executar ou treinar modelos de IA localmente aumentou significativamente. No entanto, os computadores pessoais modernos ainda não conseguem atender a essa necessidade, principalmente para modelos de linguagem de grande porte (LLMs) com bilhões de parâmetros.

Limitações dos PCs para Modelos de IA de Grande Escala

Um laptop típico possui memória suficiente apenas para carregar modelos LLMs com 8 a 13 bilhões de parâmetros, muito abaixo dos modelos de ponta que ultrapassam um trilhão de parâmetros. Mesmo as estações de trabalho mais avançadas enfrentam dificuldades para rodar LLMs acima de 70 bilhões de parâmetros.

Imagem relacionada ao artigo de IEEE Spectrum AI
Imagem de apoio da materia original.

QuietBox 2: Solução da Tenstorrent para IA Local

A QuietBox 2, da Tenstorrent, é uma tentativa de preencher essa lacuna. Apesar de se assemelhar a uma estação de trabalho PC convencional, ela abriga um hardware especializado: quatro aceleradores Blackhole desenvolvidos pela própria empresa, 128 GB de memória GDDR6 (usada em GPUs) e 256 GB de memória DDR5 para o sistema, totalizando 384 GB de memória.

Essa configuração permite carregar o modelo OpenAI GPT-OSS-120B e executar modelos de médio porte, como o Meta Llama 3.1 70B, a velocidades próximas a 500 tokens por segundo — várias vezes mais rápido que as respostas médias do OpenAI GPT-5.2 ou do Anthropic Claude 4.6.

Especificações Técnicas e Consumo de Energia

Segundo Milos Trajkovic, cofundador e engenheiro de sistemas da Tenstorrent, os 128 GB de memória GDDR6 são o que definem o tamanho do modelo que pode ser executado com desempenho razoável. Para equiparar essa memória com GPUs Nvidia RTX 5090 seriam necessárias quatro placas, o que demandaria uma fonte de energia muito maior e um custo elevado.

Enquanto a Nvidia recomenda 1.000 watts para uma única RTX 5090 — tornando inviável o uso de múltiplas placas em circuitos elétricos residenciais típicos — o QuietBox 2 consome apenas 1.400 watts em carga máxima, permitindo seu uso em escritórios domésticos sem risco de disparar disjuntores.

Design e Usabilidade

O QuietBox 2 mantém o formato micro-ATX com placa-mãe AMD e CPU AMD, com sistema de resfriamento líquido fechado semelhante ao utilizado em PCs gamers e estações de trabalho convencionais. Possui ainda iluminação RGB personalizável e uma janela semitransparente que exibe o hardware interno.

Imagem relacionada ao artigo de IEEE Spectrum AI
Imagem de apoio da materia original.

Chris Goulet, engenheiro térmico e líder de equipe da Tenstorrent, destaca a facilidade de implantação do equipamento: basta conectar, ligar e usar, sem necessidade de configurações complexas.

Diferenciais do Hardware para IA

O grande diferencial está nos aceleradores Blackhole, chips RISC-V específicos para cargas de trabalho em IA. Cada placa possui 120 aceleradores Tensix e 32 GB de memória GDDR6, totalizando 480 aceleradores e 128 GB de memória para o sistema. Além disso, cada acelerador conta com 180 MB de SRAM on-chip, otimizando o desempenho.

Concorrência e Estratégias de Mercado

Embora a Tenstorrent aposte no QuietBox 2 para uso direto pelo usuário, a Nvidia oferece soluções como o DGX Spark e DGX Station, que também se parecem com PCs, mas são voltadas para uso remoto e multiusuário. A DGX Station, com até 748 GB de memória e consumo de 1.600 watts, tem preço estimado em US$ 85.000, muito superior ao QuietBox 2, que deve chegar ao mercado no segundo trimestre de 2026 por US$ 9.999.

Enquanto a Nvidia utiliza CPUs ARM e um sistema operacional próprio (DGX OS) com foco no ecossistema CUDA proprietário, a Tenstorrent aposta em CPUs AMD x86 e uma pilha de software totalmente open source, incluindo o compilador TT-Forge e o SDK TT-Metalium, disponíveis no GitHub da Tenstorrent. A arquitetura Tensix também é aberta para desenvolvedores.

Considerações Finais para Implementação

  • Memória: 128 GB de GDDR6 para modelos grandes, 256 GB de DDR5 para o sistema.
  • Consumo: 1.400 watts em carga máxima, seguro para uso residencial.
  • Configuração: micro-ATX, CPU AMD, resfriamento líquido fechado.
  • Software: Ubuntu desktop, pilha open source para controle e desenvolvimento.
  • Preço e lançamento: US$ 9.999, disponível a partir do segundo trimestre de 2026.

Para profissionais e entusiastas que desejam executar modelos de IA avançados localmente, o QuietBox 2 representa uma alternativa acessível, eficiente e compatível com o ambiente de trabalho tradicional, sem as limitações dos PCs convencionais ou o custo exorbitante dos sistemas concorrentes.

Links úteis