Uber amplia parceria com AWS para fortalecer capacidades de IA em tempo real

A Uber anunciou a expansão de sua parceria com a Amazon Web Services (AWS) para impulsionar suas operações em tempo real e acelerar o desenvolvimento de modelos de inteligência artificial (IA). O movimento envolve a adoção ampliada dos chips personalizados da AWS, Graviton4 e Trainium3, que são projetados para otimizar o processamento computacional e o treinamento de IA em larga escala.
Contexto da parceria e objetivos estratégicos
Com bilhões de interações diárias, a Uber depende de decisões instantâneas para conectar passageiros a motoristas, calcular rotas e prever tempos de chegada. A utilização dos chips Graviton4 permitirá que essas operações em tempo real sejam realizadas com alta eficiência e menor consumo energético, especialmente durante picos de demanda.

Além disso, a Uber iniciou um piloto com os chips Trainium3 para o treinamento de seus modelos de IA. Esses modelos são fundamentais para processar a enorme quantidade de dados gerados por corridas e entregas, otimizando o pareamento entre clientes e motoristas, aprimorando previsões e personalizando recomendações.
Benefícios técnicos e econômicos da nova infraestrutura
- Desempenho em tempo real: O Graviton4 proporciona respostas em milissegundos, essenciais para a experiência do usuário na plataforma Uber.
- Eficiência energética: A infraestrutura baseada em Graviton4 reduz o consumo de energia durante os momentos de alta demanda, contribuindo para a sustentabilidade operacional.
- Treinamento avançado de IA: O Trainium3 oferece uma alternativa mais econômica e eficiente em comparação às tradicionais GPUs, tornando viável o treinamento de modelos complexos e em grande escala.
Impacto para o mercado e tendências em infraestrutura de IA
Esse movimento da Uber reflete uma tendência crescente entre grandes empresas de tecnologia, como Anthropic, OpenAI e Apple, que têm aumentado sua dependência em chips especializados para IA oferecidos pela AWS. A adoção de silício personalizado permite equilibrar desempenho, custos e eficiência energética em projetos de IA de larga escala.

Segundo Rich Geraffo, vice-presidente da AWS para a América do Norte, a parceria com a Uber exemplifica a demanda por infraestruturas específicas para IA, capazes de suportar aplicações em tempo real e com alta escala global.
Próximos passos e perspectivas
A Uber continuará a expandir o uso das tecnologias da AWS, com o potencial de integrar ainda mais os chips Trainium3 em seus processos de desenvolvimento de IA, buscando tornar cada interação na plataforma mais inteligente e eficiente.