Quando a computação atinge os limites do mundo físico

A inteligência artificial tornou-se a face visível da nova corrida tecnológica. Mas o próximo obstáculo pode estar menos nos algoritmos e mais na energia, no arrefecimento, na largura de banda e na capacidade de mover dados à escala que a nova economia exige.

A inteligência artificial é apresentada como uma revolução invisível: modelos que escrevem, programam, traduzem e analisam. Parece software puro, uma camada intangível assente em matemática e algoritmos. Mas essa leitura tornou-se incompleta. Quanto mais a IA avança, mais depende de uma base física pesada, cara e difícil de escalar. O que parece uma economia de nuvem é, na prática, uma economia de terrenos, subestações, semicondutores, fibra ótica, sistemas de arrefecimento, água, transformadores e redes de alta capacidade.

Esta é a contradição central da nova fase tecnológica. A IA prometia transformar sectores inteiros através de código; agora obriga empresas e governos a regressar a problemas industriais clássicos: onde construir, como alimentar, como arrefecer e como financiar ativos físicos de enorme escala. Segundo a Agência Internacional de Energia, os centros de dados consumiram cerca de 415 TWh em 2024, aproximadamente 1,5% do consumo elétrico mundial. Na atualização de Abril de 2026, a IEA reviu a trajetória para 485 TWh em 2025 e cerca de 950 TWh em 2030, próximo de 3% da procura elétrica global, e registou um crescimento de 17% no consumo dos centros de dados em 2025, com os data centres focados em IA a crescer 50% no mesmo ano.

A primeira vaga da IA generativa foi narrada através de modelos e aplicações; a segunda está a ser definida pela infraestrutura. Durante décadas, a digitalização parecia desmaterializar a economia, contudo, a IA veio inverter parcialmente essa narrativa: treinar e operar modelos de grande dimensão exige clusters com milhares de aceleradores, ligados por redes internas de altíssima velocidade e instalados em centros de dados com densidades energéticas crescentes.

Nos Estados Unidos, o relatório de 2024 do Lawrence Berkeley National Laboratory (LBNL) estimou que os centros de dados consumiram 176 TWh em 2023 (4,4% da eletricidade nacional) e projeta 325 a 580 TWh em 2028, entre 6,7% e 12% do consumo do país. Dados mais recentes da International Data Center Authority, de Maio de 2026, indicam que a capacidade instalada nos EUA atingiu 29,2 GW, cerca de 43% do total mundial de 67,7 GW e um aumento de 36% em dois anos, fazendo dos data centres já 6% do consumo elétrico do país. A EIA, no Annual Energy Outlook 2026, confirma a inflexão: os servidores de data center pesaram 7% do consumo elétrico do sector comercial em 2025 e deverão crescer para um intervalo entre 22% e 33% até 2050, equivalente a 446 a 818 TWh apenas em servidores. Entre 2014 e 2016 o consumo esteve quase estável; com a computação acelerada por GPU, a trajetória voltou a inclinar-se. A IA não inventou os centros de dados, mas alterou-lhes a intensidade.

Neste seguimento, a questão física da IA não se esgota no consumo elétrico: o desafio é sistémico. Um centro de dados moderno é uma fábrica de computação que recebe energia, transforma-a em operações matemáticas, dissipa calor e devolve serviços digitais. Quanto maior a procura por inferência, maior a pressão para que essa fábrica funcione em contínuo, com elevada fiabilidade e baixa latência.

Isso desloca a discussão de "quantos chips existem?" para "como funciona o sistema como na integra?". Um acelerador isolado pode ser extraordinário, mas se não comunicar com memória, armazenamento e outros aceleradores com rapidez suficiente, parte da sua capacidade fica parada.

Aqui entra o segundo grande limite: transportar dados. A IA moderna exige que enormes volumes de informação circulem dentro de um servidor, entre servidores, entre bastidores e até entre centros de dados. À medida que os modelos aumentam, a computação distribui-se por mais chips, e cada um precisa de trocar resultados intermédios com os demais. Se essa comunicação for lenta, o custo aparece como utilização ineficiente: equipamento caro à espera de dados.

A largura de banda torna-se, assim, uma variável financeira. Define quantos aceleradores podem trabalhar em conjunto, quanto tempo demora um treino, quantas consultas se processam por segundo e qual o retorno sobre o capital investido. A Cisco indicou, em 2025, que a maioria das portas de switch nas redes traseiras de IA deverá migrar para 800 Gbps em 2025 e 1.600 Gbps em 2027, uma transição excecionalmente rápida.

A consequência é simples: a próxima fase da IA será tão dependente de redes como de processadores. O chip continua no centro, mas a rede torna-se o sistema circulatório. A Nvidia descreve a quinta geração do NVLink como capaz de suportar comunicação all-to-all entre 72 GPUs, com 1.800 GB/s por GPU e 130 TB/s agregados. A lógica é clara: a IA precisa que muitos chips funcionem como uma única máquina coerente.

É neste ponto que a eletricidade regressa como restrição estratégica. Durante grande parte da era digital, a energia era vista como custo operacional, não como condicionante do crescimento. A IEA descreve o momento atual como uma entrada da economia global na "era da eletricidade", com a procura elétrica a crescer mais depressa do que a procura total de energia, impulsionada por centros de dados, IA, veículos elétricos e eletrificação industrial.

Para os centros de dados, a energia tem três dimensões: disponibilidade (ligação à rede e capacidade firme), custo (quanto maior a intensidade energética, mais sensível o modelo económico ao preço da eletricidade) e tempo (um centro constrói-se em poucos anos, mas nova geração, transmissão e subestações exigem ciclos de planeamento mais longos). A IEA sublinha esta assimetria: a tecnologia move-se depressa, o sistema elétrico exige capital elevado e horizontes lentos.

O calor é a outra face da eletricidade. Computar é dissipar energia. A eficiência mede-se pelo PUE (Power Usage Effectiveness), que compara o consumo total da instalação com o do equipamento informático. O LBNL estima que o PUE médio nos EUA caiu de 1,6 em 2014 para 1,4 em 2023, podendo descer para 1,15-1,35 em 2028, com a migração para hyperscale e o arrefecimento líquido.

A melhoria de eficiência, contudo, não elimina a restrição: pode agravá-la. À medida que os centros se tornam mais eficientes por unidade de computação, a procura cresce. Ganhos de eficiência reduzem o custo unitário e podem aumentar o consumo total. Pesquisa, programação, publicidade, investigação científica, medicina, finanças e defesa podem todas absorver mais computação se o preço baixar.

Após a questão da eletricidade e do calor surge outro limite menos visível: o cobre. As ligações elétricas continuam indispensáveis nos sistemas informáticos, baratas e fiáveis em distâncias curtas. Mas enfrentam dificuldades crescentes quando se combinam maior velocidade, maior distância e maior densidade: os sinais perdem qualidade, exigem mais correção, consomem mais energia e geram mais calor. Neste contexto, o cobre não desaparece, mas deixa de ser a resposta universal.

A indústria está a adaptar-se. Em ligações curtas, o cobre continuará competitivo, contudo, em ligações mais longas ou de maior largura de banda, a ótica ganha peso. A fronteira económica entre as duas tecnologias move-se com a velocidade dos sinais, o custo dos transcetores, a densidade dos bastidores e o preço da energia. O relatório da Cisco sobre 800G sublinha que a próxima geração de redes depende em simultâneo de módulos óticos, cabos direct attach copper, switch ASICs e normalização 800GE: a transição será híbrida, não binária.

É aqui que a luz entra na arquitetura da computação. A fotónica (o uso da luz para transmitir e processar sinais) não é nova: a fibra ótica sustenta há décadas as telecomunicações globais. A novidade é a aproximação da ótica ao interior dos centros de dados e, em certos casos, ao próprio pacote do chip. A fotónica integrada e a fotónica de silício procuram fazer com a luz aquilo que os semicondutores fizeram com os eletrões: miniaturizar, integrar e produzir em escala.

O conceito de co-packaged optics, ou CPO, resume esta direção. Em vez de manter os transcetores óticos como módulos pluggable afastados do chip, a ótica é colocada junto ao ASIC de rede, reduzindo a distância percorrida pelo sinal elétrico e, com ela, perdas, consumo e limitações de largura de banda. A Ansys descreve a CPO como resposta a desafios de densidade, latência, alcance do cobre e eficiência energética, aproximando ótica e eletrónica no mesmo sistema.

A Nvidia está a incorporar esta lógica em produtos de rede para IA: os sistemas Quantum-X e Spectrum-X Photonics usam fotónica de silício integrada e CPO, com configurações de 102,4 Tb/s e 409,6 Tb/s e portas de 800 Gb/s. O ponto não é apenas a velocidade, é redesenhar a infraestrutura para que a movimentação de dados não anule os ganhos dos aceleradores.

Esta mudança altera a história dos semicondutores. A lógica de Moore (transístores mais pequenos, maior densidade, melhor desempenho por watt) não acabou, mas tornou-se insuficiente. A nova corrida é sobre integração: juntar computação, memória, rede, ótica, substratos, embalagem avançada e software num sistema coerente. O desempenho deixa de ser propriedade do chip isolado e passa a ser do conjunto.

O melhor exemplo é a memória. Os modelos de IA precisam de alimentar as operações com dados, daí a importância da HBM (High Bandwidth Memory), uma memória com módulos sobrepostos colocada junto ao processador. Aproximar memória e lógica exige técnicas avançadas de embalagem, como CoWoS, que integram dies lógicos e módulos de memória sobrepostos num mesmo substrato. A Epoch AI estima que, em 2025, os quatro maiores designers de chips de IA consumiram cerca de 90% da capacidade global de CoWoS e de fornecimento de HBM, mas apenas cerca de 12% da produção de dies lógicos avançados.

Para os investidores, a implicação é direta: a cadeia da IA é mais longa do que parece. A primeira fase concentrou-se nos vencedores óbvios (plataformas de cloud, GPUs, software, memória). A próxima pode ser mais difusa, dependendo também de empresas de eletricidade, operadores de redes, equipamento de arrefecimento, fibra, módulos óticos, switches, lasers, materiais avançados e substratos.

Nem todos serão bons investimentos: alguns serão cíclicos, outros enfrentarão pressão de margens, excesso de capacidade ou substituição tecnológica. A cadeia física cria oportunidades, mas também riscos: atrasos em ligações elétricas, escassez de componentes, dependência de poucos clientes hyperscale, volatilidade de capex e valorizações que antecipam vários anos de crescimento. O essencial é deixar de olhar apenas para a camada visível da aplicação.

A história da tecnologia tem sido contada como uma sucessão de camadas cada vez mais abstratas: do hardware para o software, do software para a cloud, da cloud para a IA. Mas cada uma dessas camadas continua a repousar sobre uma infraestrutura física concreta. A IA está a tornar essa infraestrutura mais valiosa e mais escassa. O futuro da computação será decidido tanto pela qualidade dos modelos como pela capacidade de fornecer energia, dissipar calor, mover dados e integrar sistemas em escala industrial.

A computação atinge os limites do mundo físico não porque a inovação esteja a acabar, mas porque está a mudar de lugar. O desafio já não é apenas colocar mais transístores num chip: é construir uma arquitetura em que eletricidade, silício, memória, rede e luz funcionem como uma só máquina. Para quem está nos mercados, talvez seja a lição mais importante desta fase da IA: a próxima fronteira está menos no algoritmo que todos veem e mais nas camadas invisíveis que tornam possível a sua execução.

Miguel Ricon Ferraz, Analista Financeiro e Responsável pelo Serviço de Consultoria de Investimento do Banco Carregosa

Quando a computação atinge os limites do mundo físico

Partilhe este artigo