web counter A negociação bilionária da Meta com a Graviton revela a crescente escassez de CPUs na infraestrutura de IA e indica uma mudança para cargas de trabalho de inferência Agentic, aumentando a demanda - Super Select
Home » A negociação bilionária da Meta com a Graviton revela a crescente escassez de CPUs na infraestrutura de IA e indica uma mudança para cargas de trabalho de inferência Agentic, aumentando a demanda
Tecnologia, Hardware e PC

A negociação bilionária da Meta com a Graviton revela a crescente escassez de CPUs na infraestrutura de IA e indica uma mudança para cargas de trabalho de inferência Agentic, aumentando a demanda

A Meta firmou um contrato de vários bilhões de dólares com a Amazon Web Services (AWS) para implementar milhões de núcleos de CPU Graviton5 em seus data centers. Isso posiciona a Meta entre os cinco maiores clientes de Graviton no mundo. O foco do acordo está em cargas de trabalho de IA agente, que exigem processamento intenso de CPU, diferindo do treinamento com GPU. O CEO da Amazon, Andy Jassy, destacou que a IA agente está se tornando tão relevante para CPUs quanto para GPUs.

A Meta já mantém contratos com Nvidia, AMD, Broadcom, Google, CoreWeave e Nebius, mas escolheu a AWS especificamente por seus CPUs de uso geral. Santosh Janardhan, responsável pela infraestrutura da Meta, mencionou que diversificar as fontes de computação é uma estratégia essencial e que o Graviton permite executar as cargas de trabalho de IA agente com a performance e eficiência necessárias em grande escala.

O Graviton5, apresentado pela AWS em dezembro, possui 192 núcleos Arm Neoverse V3 em um processo de 3nm e cerca de 180 MB de cache L3, representando um aumento significativo em relação ao Graviton4. A AWS afirma ter melhorado o desempenho em 25% e diminuído a latência entre núcleos em 33%. O contrato terá duração de pelo menos três anos, com a maioria da capacidade sendo implantada nos Estados Unidos.

A crescente demanda por IA agente está alterando significativamente a proporção de CPUs em relação a GPUs. Enquanto o treinamento de modelos de linguagem grandes (LLMs) depende de grandes quantidades de GPUs, a inferência de IA agente requer CPUs devido a processos complexos, como controle de fluxo e execução de loops de validação. Recentemente, o CFO da Intel, David Zinsner, observou que a razão de CPUs para GPUs em data centers caiu de 1:8 para 1:4, com possibilidade de se aproximar de 1:1 no futuro.

Além disso, a Arm destacou que um data center de IA típico agora precisa de cerca de 30 milhões de núcleos de CPU por gigawatt de capacidade. No entanto, com cargas de trabalho de IA agente, esse número sobe para aproximadamente 120 milhões de núcleos, refletindo a exigência aumentada por processos que operam continuamente.

As restrições de fornecimento estão se tornando um desafio, com a demanda crescente por CPUs enfrentando dificuldades em uma cadeia de suprimentos planejada para um mundo dominado por GPUs. Os prazos para servidores de CPU já se estenderam para cerca de seis meses, um aumento considerável em relação a duas semanas antes do aumento da demanda por IA.

A Meta está respondendo a essas dificuldades ao diversificar a aquisição de CPUs. Além do contrato com a Graviton5, a empresa co-desenvolveu a CPU AGI da Arm e planeja utilizá-la junto com aceleradores de inferência MTIA construídos pela Broadcom. A Meta também firmou um acordo de 100 bilhões de dólares com a AMD para CPUs e GPUs.

Enquanto isso, a Nvidia está lançando sua própria CPU Vera como um produto independente, refaturando tendências semelhantes no setor, onde cada vez mais fabricantes estão garantindo fontes de fornecimento a longo prazo para atender à demanda por cargas de trabalho de IA agente.

O gasto em infraestrutura deve crescer consideravelmente nos próximos anos, com os cinco principais hiperescaladores planejando gastar cerca de 750 bilhões de dólares até 2026, um aumento de 67% em relação ao ano anterior. A Meta está investindo cada vez mais em infraestrutura de IA, sinalizando que sua própria capacidade de fornecimento não é suficiente para atender à necessidade de computação geral.

Membro da Super Select:

Marcelo Vangrey

A minha jornada como Vangrey no universo dos games começou em 1994 com um Mega Drive e o incrivel Mortal Kombat 2! Seguida pelo Super Nintendo no universo dos lendários cartuchos 16in1 com Top Gear e companhia! Em 1998, conquistou seu primeiro PLAY 1 novamente com Mortal Kombat, dessa vez o MK4, e a partir daí, continuou explorando diversas plataformas. Comprando e vendendo, já passei por: Game Boy Color, PS2, PSP, PS3, Nintendo DS, 3DS, Xbox 360, PS4, PS4 Pro, PS5, Nintendo Switch 1 e 2, e pra finalizar - o Steam Deck =)

Adicionar comentário

Clique aqui para postar um comentário