Por que os preços das GPUs estão disparando descontroladamente?
Título Original: A Grande Escassez de GPUs – Capacidade de Aluguel – Lançando nosso Índice de Preços de Aluguel de 1 Ano do H100
Autores Originais: Daniel Nishball, Jordan Nanos, Cheang Kang Wen, etc.
Tradução: Peggy, BlockBeats
Nota do Editor: À medida que a IA transita de "ferramenta" para "infraestrutura de fluxo de trabalho", os preços de aluguel de GPUs entraram em uma fase de aumento acelerado, com a oferta continuando a se restringir.
Desde um aumento de quase 40% no preço do H100 em um ano, até o poder de hashing sendo bloqueado até a segunda metade de 2026, e ainda mais, laboratórios de IA continuamente bloqueando a oferta por meio de contratos de longo prazo e mecanismos de renovação, a lógica operacional do mercado de GPUs passou por mudanças significativas: os preços não são mais determinados principalmente pelos custos de hardware, mas são moldados coletivamente pelo consumo de tokens, capacidades dos modelos e eficiência de produção.
As mudanças do lado da demanda são particularmente cruciais. Novos paradigmas, como sistemas multiagentes, geração de conteúdo nativo, ferramentas de programação de IA, etc., estão impulsionando o uso de tokens para uma fase de crescimento exponencial. A conclusão central do relatório também está se tornando clara: o ROI das ferramentas de IA foi validado, com um retorno de 5 a 10 vezes, tornando difícil para os preços do poder de hashing restringirem efetivamente a demanda por um bom tempo.
A tensão resultante está se tornando cada vez mais clara: o mercado real de poder de hashing está experimentando uma escassez abrangente e um aumento no poder de precificação, enquanto o mercado de capitais ainda está preso na expectativa de "eventual excesso de oferta e comoditização." Esse desconforto entre expectativa e realidade está reformulando a lógica de avaliação da corrida pela infraestrutura de IA.
À medida que o poder de hashing se torna um novo meio de produção, seu mecanismo de preço, estrutura de oferta e retornos de capital estão passando por uma reestruturação profunda.
A seguir está o texto original:
O Claude 4.6 Opus e o Claude Code da Anthropic tiveram um aumento significativo na demanda. Sua receita recorrente anual (ARR) disparou de $9 bilhões no final do ano passado para mais de $25 bilhões em apenas um trimestre, alcançando um crescimento quase três vezes maior. Ao mesmo tempo, modelos de código aberto representados pelo GLM e Kimi K2.5 também impulsionaram a rápida expansão de aplicações relacionadas a modelos de código aberto. O financiamento contínuo de empresas como Anthropic, OpenAI e várias Neolabs está intensificando a demanda por recursos de GPU.
Este ponto de inflexão significa um aumento rápido na demanda em um curto período de tempo, com hyperscalers e provedores de nuvem emergentes (Neoclouds) passando por uma onda de compras de GPUs.
Essa nova demanda está elevando os preços em toda a cadeia de suprimentos, desde DRAM e armazenamento NAND até cabos de fibra óptica, hospedagem de data centers e até infraestrutura como turbinas a gás. Praticamente todos os produtos e serviços relacionados estão enfrentando aumentos.
Os preços de aluguel de GPU se tornaram a mais recente área em uma gama de produtos e serviços relacionados a computação a ver restrições de oferta e aumentos de preços. O preço de um contrato de aluguel de GPU por um ano para uma GPU H100 aumentou de um ponto baixo de $1,70 por GPU por hora em outubro de 2025 para $2,35 em março de 2026, quase um aumento de 40%.
A capacidade de aluguel de GPU sob demanda está quase totalmente esgotada em todos os modelos—usuários que garantiram instâncias sob demanda estão relutantes em liberar poder computacional de volta ao mercado mesmo após os aumentos de preços. No início de 2026, encontrar poder computacional de GPU é como tentar pegar o último assento em um voo: os preços estão altos e a disponibilidade é escassa. Uma analogia mais adequada pode ser menos sobre pegar um assento em um voo e mais sobre "tentar encontrar uma fonte para medicamentos."

Na SemiAnalysis, temos acompanhado há muito tempo várias tendências e questões-chave no Neocloud e no ecossistema de nuvem hyperscale, incluindo preços de aluguel de GPU. Essa capacidade decorre de nossa pesquisa contínua e prática em projetos como ClusterMAX, InferenceX e o custo total de propriedade (TCO) da nuvem de IA.
Simultaneamente, dedicamos um esforço significativo para ajudar vários laboratórios de IA a se conectarem com provedores de serviços Neocloud, buscando recursos de aluguel de GPU no mercado e mantendo comunicação contínua com quase todas as partes interessadas no ecossistema sobre mudanças nos preços de aluguel de GPU.
Desde 2023, estabelecemos e mantivemos um sistema de índice de preços de aluguel de GPU para clientes, cobrindo modelos de GPU mainstream como H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355, em diferentes termos de locação, desde aluguéis sob demanda, aluguéis de curto prazo de um mês até contratos estendidos de 5 anos. Este índice é construído com dados de pesquisa de vários provedores de serviços Neocloud e compradores de computação, validados por meio de dados de transações reais e resultados de negociações que facilitamos.

Hoje, estamos abrindo o índice de preços de aluguel de GPU H100 por um ano ao público, visando fornecer à indústria mais dados e insights. Este índice será atualizado mensalmente, e continuaremos a liberar as análises de tendências mais recentes e observações de mercado através do X e LinkedIn. Quanto a dados abrangentes de preços cobrindo diferentes estruturas de locação e outros modelos de GPU mainstream, essas informações estão atualmente disponíveis apenas para usuários institucionais inscritos em nosso modelo de TCO da nuvem de IA.
Este relatório se concentrará nas últimas tendências do mercado de aluguel de GPU, observações de linha de frente do mercado e dados-chave para analisar como entendemos a estrutura geral do mercado e fazer um julgamento preliminar sobre as tendências futuras de preços de aluguel.
O mercado de aluguel de GPUs entra na fase de "precificação dinâmica".
Apenas observar a curva de preços de aluguel do H100 ao longo de um ano não é suficiente para mostrar completamente o nível de tensão do mercado— a experiência real de aquisição de poder computacional na linha de frente e o feedback dos participantes do mercado refletem uma situação mais severa.
A demanda atual vem de múltiplos cenários de uso altamente heterogêneos, com quase nenhuma "solução única para todos". Por exemplo, do lado da inferência, modelos de mistura de especialistas em larga escala (MoE) são mais adequados para rodar nos mais recentes sistemas de grande escala como o GB300 NVL72; e do lado do treinamento, o H100 ainda mantém sua vantagem em relação à relação custo-benefício, então mesmo para uma GPU de "geração relativamente mais antiga", a demanda permanece alta.
Os clientes agora estão até pagando ansiosamente até $14 por GPU por hora para instâncias preemptivas AWS p6-b200; alguns dos principais provedores de serviços Neocloud pararam de vender nós únicos; alguns preços de renovação do H100 são os mesmos de quando foram assinados há dois a três anos; e alguns contratos do H100 foram renovados diretamente até 2028, com um período de locação de até 4 anos. Agora, não é fácil encontrar até mesmo um cluster H100 ou H200 de 8 nós (64-GPUs)—metade dos provedores de serviços que perguntamos estão completamente esgotados, e a maioria dos provedores de serviços responde que não haverá GPUs da arquitetura Hopper expirando e sendo liberadas tão cedo.
Ouvimos até que alguns inquilinos de poder computacional estão começando a subdividir e sublocar os clusters que alugaram, assim como dividir e sublocar um apartamento durante o Grande Prêmio de Mônaco. Veremos a emergência dos chamados "sublocadores Neocloud" a seguir? Provavelmente não é mais apenas uma piada.
O fornecimento de Blackwell também está extremamente apertado. Soube que, devido à forte demanda por modelos de peso de código aberto e à demanda explosiva contínua por inferência, o ciclo de implantação e entrega de um novo lote de clusters Blackwell agora foi estendido para junho a julho. Além disso, a maioria desses clusters que estão por vir já foram pré-reservados. Na verdade, olhando para todo o mercado, a capacidade adicional que não entrará em operação até agosto a setembro de 2026 está quase totalmente reservada.
Preços de Aluguel de GPUs: Fazendo um Retorno
Mas como o mercado chegou a esse ponto? Apenas 6 meses atrás, a maioria dos observadores do mercado ainda mantinha uma atitude cética em relação ao "valor terminal" das GPUs e acreditava, em geral, que os preços de aluguel de GPUs inevitavelmente continuariam a cair ao longo do tempo. Naquela época, se um provedor de nuvem Neocloud ou hyperscale adotasse um ciclo de depreciação de 6 anos para ativos de computação em GPU em seu modelo financeiro, eles seriam até criticados por analistas financeiros. Antes de discutir as tendências futuras, vamos revisar rapidamente como as coisas evoluíram até este ponto.
Até a segunda metade de 2025, a expectativa predominante em todo o ecossistema sempre foi que, com a ampla implantação do Blackwell e seu custo unitário de computação significativamente mais baixo, os preços de locação do Hopper (ou seja, H100 e H200) cairiam drasticamente. No entanto, a realidade se revelou ser o oposto. Na segunda metade de 2025, a demanda pelo H100 não apenas não enfraqueceu, mas foi ainda mais fortalecida em muitos cenários. A rápida adoção de modelos de peso aberto e a contínua aceleração da demanda por inferência naquela época foram os primeiros sinais dessa onda quase interminável de demanda por poder computacional.
Em janeiro de 2026, o mercado de poder computacional testemunhou o próximo ponto de inflexão: após vários trimestres de aumento rápido, os preços de armazenamento DRAM e NAND começaram a entrar em uma fase de aumento quase "parabólica". De acordo com nosso modelo de armazenamento, no primeiro trimestre de 2026, os preços contratuais do LPDDR5 e do DDR5 apresentaram aumentos anuais de quase quatro e cinco vezes, respectivamente.
Para lidar com o aumento acentuado nos custos dos componentes e os riscos de margem de lucro que isso trouxe, os fabricantes OEM começaram a aumentar os preços dos servidores de IA, e os aumentos de preços foram significativamente maiores do que os dos próprios componentes subjacentes. Isso tornou as decisões de despesas de capital em cluster mais complexas: os custos mais altos de aquisição de servidores comprimiram os retornos esperados dos projetos, forçando alguns operadores a desacelerar a implantação ou até mesmo abandonar projetos planejados diretamente. Como resultado, parte do fornecimento adicional originalmente planejado que poderia ter entrado em operação foi adiado ou arquivado, exacerbando ainda mais a escassez no mercado de leasing.

Nesse caos de aquisição desencadeado pelos "preços descontrolados dos servidores de IA", a demanda por leasing de GPU acelerou significativamente, e o poder computacional restante no mercado foi quase totalmente absorvido em janeiro e fevereiro. Em março, fosse H100, H200 ou B200, mal havia capacidade disponível sob qualquer prazo de leasing. O preço de leasing de um ano já havia ultrapassado $2 por GPU por hora até o final de janeiro e subiu novamente de 15% a 20% na segunda metade de fevereiro em comparação com o final de janeiro, com um aumento esperado adicional de 15% a 20% mês a mês até o final de março.
Um dos principais motores da demanda no início deste ano veio da geração nativa de mídia. Aplicativos como Seedance e Nano Banana estão levando os usuários a gerar e iterar em imagens e vídeos em grande escala, aumentando significativamente o throughput de tokens. No entanto, a fonte de demanda mais crítica e visível é o aumento das cargas de trabalho multiagente—sistemas que executam processos de múltiplas etapas, iteram continuamente em ambientes de alta concorrência e impulsionam o consumo de tokens e os requisitos de poder computacional para apresentar um crescimento "exponencial".
Essa tendência é particularmente evidente nos dados relacionados ao Claude Code, como mencionamos em vários artigos anteriormente. Tomando a SemiAnalysis como exemplo, apenas nos últimos 7 dias, a empresa consumiu internamente dezenas de bilhões de tokens, com um custo médio de cerca de $5 por milhão de tokens. No entanto, o tempo economizado, a expansão do fluxo de trabalho e as capacidades aprimoradas superam em muito o custo em si. Hoje, a SemiAnalysis incorporou um conjunto completo de ferramentas de IA em vários fluxos de trabalho, não mais limitadas a busca e resumo simples, mas estendidas a painéis de dados, raspagem automatizada, processamento de dados em larga escala e cenários de modelagem financeira baseados em agentes.
Também acompanhamos o crescimento explosivo dessa demanda por meio de métricas como os Compromissos Diários do Claude para monitorar essa tendência. Na taxa atual, esperamos que até o final de 2026, o Claude Code represente mais de 20% de todos os compromissos de código. Pode-se dizer que, sem que você saiba, a IA já começou a "devorar" todo o processo de desenvolvimento de software. Para clientes institucionais interessados em acessar este conjunto de dados, entre em contato com nossa equipe de API. Um pequeno spoiler: este volume de commits já é significativamente maior do que quando lançamos inicialmente.

Em nosso círculo, quase todos são usuários frequentes do Claude Code. Mas também entendemos que esse círculo em si está profundamente imerso no campo de IA e semicondutores, essencialmente apenas "um pequeno grupo na vanguarda."
Para muitas empresas da Fortune 500 e o público em geral, o Claude Code e o "mundo dos agentes" são apenas um tópico um tanto novo, aparecendo ocasionalmente no feed do Facebook ou em podcasts da NPR. Eles mal perceberam que uma onda de produtividade e um choque estrutural impulsionados por agentes estão se aproximando.

À medida que mais participantes da economia real percebem gradualmente o surpreendente retorno sobre investimento do uso de ferramentas de IA e se juntam a esta "onda de poder computacional," o consumo de tokens continuará a mostrar crescimento gradual. O debate sobre o ROI do investimento em IA, de fato, se estabeleceu—o valor criado pelo uso de ferramentas de IA frequentemente supera seu custo em uma ordem de magnitude. Nesse contexto, o deslocamento contínuo para a direita da curva de demanda de tokens está formando uma força forte e (neste estágio) relativamente inelástica, elevando continuamente os preços de aluguel de GPU.
Em termos simples, se o ROI do uso de ferramentas de IA pode alcançar de 5 a 10 vezes, então os preços de aluguel de GPU ainda têm um espaço considerável para subir antes de realmente restringir a demanda. Também não descartamos que novos aumentos nos preços de aluguel continuarão a repercutir para cima, elevando os custos de servidores e componentes principais.
Índice de Preço de Aluguel de Um Ano do SemiAnalysis H100 Liberado
Hoje, estamos tornando o índice de preço do contrato de aluguel de um ano do H100 do SemiAnalysis livremente disponível ao público, visando aumentar a conscientização do mercado e a transparência das tendências de preços de aluguel de GPU.
Este índice é construído com base em dados de pesquisa mensal de mais de 100 participantes do mercado, incluindo provedores de serviços Neocloud, compradores e vendedores de hashpower, para estabelecer uma faixa representativa (25º ao 75º percentil) de preços de aluguel de GPU. Além disso, validamos cruzadamente com dados de transações reais, facilitamos negociações dentro de nossa rede para calibrar ainda mais os níveis de preços.

Desde 2023, temos monitorado os preços de contratos para GPUs, incluindo H100, H200, B200, B300, GB200, GB300, em termos de aluguel que variam de 3 meses a 5 anos; também incluímos dados sobre a série AMD (MI300, MI325, MI355).
Comparado aos índices de GPU existentes no mercado, o índice de preço do contrato de aluguel de um ano do H100 do SemiAnalysis possui várias diferenças-chave:
Primeiro, muitos índices de aluguel de GPU são baseados em cotações spot/on-demand ou preços de lista públicos, mas na realidade, a maioria das transações de aluguel de GPU é realizada por meio de contratos de longo prazo, frequentemente com termos de 6 meses ou mais. Esses preços geralmente são estabelecidos por meio de negociações bilaterais e não são listados publicamente. A maioria dos principais provedores de serviços Neocloud prefere assinar contratos de pelo menos 1 ano, sendo 2-3 anos mais comum, e idealmente garantir um acordo de atacado em larga escala de 5 anos. O índice de aluguel de um ano da H100 da SemiAnalysis foca neste "mercado de contratos" — a parte mais líquida do mercado. Ao direcionar explicitamente um prazo de aluguel específico, este índice é mais fácil para os usuários entenderem o segmento de mercado que cobre e compará-lo com suas próprias observações.
Em segundo lugar, os preços divulgados publicamente não representam os preços reais de transação. Os preços compartilhados pelos provedores de nuvem hyperscale e Neocloud são mais indicativos de tendências do que de níveis reais de negociação. Esses preços frequentemente ficam atrás das mudanças no mercado de contratos e são tipicamente ajustados após mudanças na demanda de hashpower terem ocorrido. Especialmente no mercado sob demanda, os preços geralmente são definidos em níveis relativamente fixos, com as mudanças reais de oferta e demanda refletidas através da utilização ou uso de recursos, e ajustes feitos irregularmente apenas quando necessário. Mais detalhes sobre esse mecanismo de mercado serão abordados nas seções subsequentes deste artigo.
Além disso, embora existam muitos índices no mercado que podem lidar com dados de cotações, preços e transações em larga escala, e tenham uma vantagem na análise de tendências, nossa abordagem enfatiza a interação direta com os participantes do mercado. Por trás de cada cotação e cada transação está seu contexto específico e lógica de decisão. Esperamos apresentar dados quantitativos enquanto também suplementamos essas informações qualitativas e observações de primeira mão, a fim de retratar de forma mais abrangente a verdadeira estrutura do mercado de aluguel de GPU.
Para usuários de assinatura institucional, também fornecemos dados completos da estrutura de prazos cobrindo quase todos os principais mercados de aluguel de GPU.

Juntamente com o lançamento do índice de preços de contrato de um ano para a H100, também lançamos o Painel de Tokenomics da SemiAnalysis para usuários de assinatura do modelo de Tokenomics em nível institucional, para rastrear e entender a paisagem dos modelos de IA de ponta. Este painel apoia os usuários em comparações personalizadas em múltiplas dimensões, como código, inferência, matemática e avaliação de agentes de IA, comparando preços de API de diferentes modelos e provedores de serviços, e visualizando dados-chave divulgados por grandes laboratórios de IA, incluindo uso de tokens, receita, avaliação e base de clientes.
Estrutura Atual do Mercado de Aluguel de GPU
Até a segunda metade de 2025, o ambiente de preços do mercado de aluguel de GPU era relativamente mais competitivo. Naquela época, os operadores tinham um estoque de GPU mais abundante em mãos, enquanto a demanda final estava apenas começando a acelerar. Portanto, a competição entre vários provedores de serviços Neocloud era acirrada, geralmente competindo por clientes oferecendo preços mais atraentes. O objetivo central era aumentar a utilização e "extrair" totalmente o valor dos ativos de poder computacional existentes antes que o próximo ciclo de iteração de GPU chegasse.
No entanto, o cenário do mercado desde então fez uma virada de 180 graus. Hoje, a Neocloud e os provedores de nuvem hyperscale assumiram o controle total—seu objetivo principal é aumentar a utilização o máximo possível antes do próximo ciclo de iteração de GPU e extrair o valor de seus ativos de poder computacional existentes. Eles podem exigir pré-pagamentos mais altos, melhores preços, prazos de contrato mais longos e até escolher os horários de início e término dos contratos para corresponder aos seus arranjos de inventário e capacidade. Ao mesmo tempo, o tempo também está a favor do lado da oferta: eles podem implantar em seu próprio ritmo, selecionando gradualmente a melhor mistura de clientes em um ambiente de preços crescentes.
Estruturalmente, o mercado de leasing de GPU pode ser aproximadamente dividido em três segmentos principais, com cada segmento correspondendo a diferentes tipos de demandas dos clientes:
Leasing de curto prazo: sob demanda, spot e contratos de menos de 3 meses
Contratos de médio prazo: contratos que variam de 3 meses a mais de 3 anos
Acordo de Compra: Um contrato de 4 a 5 anos, sendo 5 anos a duração mais comum
Leasing de Curto Prazo: Sob demanda, spot e contratos de menos de 3 meses
O leasing de curto prazo está no início de toda a estrutura de termos de leasing e muitas vezes corresponde a "capacidade excedente." No entanto, alguns provedores de serviços (como Runpod, Lambda) se concentram em fornecer poder computacional sob demanda ou spot substancial e flexível.
É importante notar que o mecanismo de precificação no mercado sob demanda é significativamente diferente de outros mercados de contrato. Normalmente, os provedores de serviços definem um nível de preço relativamente fixo para recursos sob demanda e o ajustam apenas em muito poucos casos. Em outras palavras, o preço no mercado de curto prazo não é totalmente impulsionado pela oferta e demanda em tempo real, mas reflete a rigidez do mercado por meio de mudanças na utilização de recursos.

Os provedores de serviços geralmente ajustam os preços com base na utilização de recursos de forma pontual: quando a utilização é baixa, eles reduzem os preços para estimular a demanda, e quando a utilização está próxima da capacidade total, eles aumentam os preços porque a demanda permanece alta mesmo em um nível de preço mais alto.
Isso também explica por que, em uma visão de série temporal, a precificação sob demanda da Neocloud muitas vezes permanece inalterada por um longo período e então, de repente, experimenta um aumento ou diminuição repentina. Para o mercado sob demanda, o que realmente reflete as mudanças na demanda com alta frequência não é o preço, mas a taxa de utilização de recursos.

Fonte: Lambda Labs, SemiAnalysis
Contratos de Médio Prazo
Do ponto de vista econômico, o que é realmente mais crítico é o "mercado de contratos", pois a vasta maioria do valor das transações de leasing de GPU ocorre neste segmento. Dentre esses, o contrato de 1 ano é particularmente importante—ele reflete tanto a demanda marginal dos clientes de laboratórios não-AI quanto a demanda excedente de grandes clientes, tornando-se o indicador mais sensível do aperto do mercado.
Empresas nativas de IA e laboratórios de IA de pequeno a médio porte estão principalmente ativos na faixa de 1 a 3 anos. No entanto, uma tendência notável recente é que essas instituições também estão começando a tentar garantir recursos computacionais por meio de contratos de longo prazo—muitos dos quais foram estendidos para mais de 4 anos e estão até dispostos a pagar mais de 20% de pagamento antecipado, o que não era comum em contratos de mais de 4 anos no passado.
Contratos de Longo Prazo
No mercado de longo prazo de 4 a 5 anos, os principais players são grandes laboratórios de IA que garantem recursos computacionais em larga escala desde o início. Essas transações geralmente correspondem a clusters de 50MW, 100MW ou até maiores, aproximadamente equivalentes a cerca de 24.000 a 48.000 unidades de GPU GB300 NVL72. No geral, tais acordos de longo prazo capturaram uma parte significativa do mercado de leasing de GPU da Neocloud.
Os laboratórios de IA favorecem esses contratos porque podem garantir recursos computacionais em larga escala de uma só vez para atender à demanda crescente dos usuários finais. Ao mesmo tempo, essas instituições frequentemente se envolvem profundamente no design de clusters, incluindo aspectos-chave como armazenamento, rede, configuração de CPU e mais. Essas transações são frequentemente entregues na forma de **bare metal**, uma vez que os laboratórios de IA possuem capacidades de engenharia suficientes para personalizar a pilha tecnológica em um nível mais baixo, alcançando assim o Custo Total de Propriedade (TCO) e desempenho ideais.
Para os provedores de serviços da Neocloud, essas transações também são atraentes. Por um lado, eles podem concentrar recursos de vendas em alguns grandes pedidos sem lidar com numerosos clientes de pequeno porte, mas ainda assim gerar a mesma receita. Por outro lado, contratos de longo prazo também facilitam melhores condições de financiamento de dívida—alinhando o prazo de financiamento com a duração do contrato, eles podem efetivamente reduzir o descompasso de prazo e os riscos de flutuação de preços, e na maioria dos casos garantir a Taxa Interna de Retorno (TIR) do projeto em pontos percentuais de dois dígitos.
Além disso, os hyperscalers frequentemente atuam como um "backstop" nesse processo—servindo como compradores diretos, eles adquirem poder computacional da Neocloud e o revendem para laboratórios de IA. Essa estrutura é vantajosa para todas as partes: A Neocloud pode obter melhores condições de financiamento com base em compradores com classificação AAA, enquanto os hyperscalers podem participar dos retornos do projeto fornecendo endossos de crédito sem expandir seus balanços patrimoniais.
A tabela abaixo descreve alguns dos grandes acordos de offtake que estamos monitorando. Realizaremos análises aprofundadas dessas transações para deduzir seu preço horário implícito de GPU ($/hr/GPU), bem como métricas de lucratividade chave, como TIR do projeto e margem EBIT.

No atual ambiente de mercado, a vasta maioria dos grandes clusters de IA em expansão é, na verdade, "consumida internamente" por laboratórios de IA. No entanto, essas instituições ainda entram no mercado de contratos de menos de 4 anos para complementar o poder computacional, enquanto previnem indiretamente que a oferta reentre no mercado ao renovar clusters existentes H100 e H200. À medida que os superclusters GB200 e GB300 são gradualmente lançados, como a relação entre oferta e demanda no mercado de contratos de 1 a 3 anos evolui será uma variável chave a ser observada no futuro próximo.
「Para Onde o Puck Está Indo」
O desenvolvimento mais intrigante atualmente é a aparente desconexão entre a realidade subjacente e o sentimento do mercado. Apesar de sinais claros de restrições de oferta, os aumentos de preços (todos positivos para a Neocloud – expansão de margem e extensão da vida útil dos ativos), os mercados públicos tornaram-se cada vez mais pessimistas em relação a empresas como CoreWeave, Nebius, Iris Energy, com seus preços de ações ainda languindo perto das mínimas dos últimos 6 a 12 meses.
O mercado continua dominado por uma narrativa de "supraoferta definitiva, comoditização do poder de hash", com as mudanças mencionadas não conseguindo aliviar as preocupações dos investidores sobre o valor de longo prazo das GPUs. No entanto, no terreno, a manutenção da escassez de oferta e o aumento do poder de precificação significam que quase todo o poder de hash está em um estado de absorção da demanda – mesmo com discrepâncias de desempenho, ainda há um caso claro de demanda superando a oferta no atual ambiente de escassez extrema.
Três Observações Chave para o Futuro
Para avaliar se os preços de locação de GPUs permanecerão elevados, concentre-se em três variáveis-chave:
1. Ritmo de Expansão do Cluster GB300 (2026)
O aspecto crucial é a velocidade relativa entre o novo poder de hash e a demanda por tokens – se a oferta alivia a escassez ou se a demanda continua a superar a oferta. Isso impactará diretamente se os laboratórios de IA continuarão a participar do mercado de menos de 4 anos e a trajetória de preços dentro dessa faixa.
2. Deterioração Adicional das Falta de Chips
Isso inclui a capacidade do processo TSMC N3, HBM, DRAM, NAND e outros elos críticos onde quaisquer flutuações no nível de execução da fabricação poderiam apertar ainda mais a oferta.
3. Receita Recorrente Anual (ARR) de Laboratórios de IA e Taxa de Crescimento do Consumo de Tokens
A comercialização da IA e a escala de uso determinarão a intensidade da demanda final, que é uma variável central que impulsiona a demanda por poder de hash.
Movimento Unidirecional de Preço com Retornos Aumentados
De modo geral, uma conclusão relativamente clara é que a probabilidade de os preços de locação de GPU continuarem a subir é maior do que a probabilidade de uma queda.
Esse processo exibe uma característica clara de auto-reforço: à medida que a Neocloud observa o aperto da oferta e o aumento dos preços, ela garante mais hardware com antecedência, comprimindo ainda mais a oferta do mercado e impulsionando os preços para cima. Isso é semelhante ao ciclo de escassez de GPU de 2023–2024 – onde as restrições de oferta impulsionaram uma expansão significativa das margens para os OEMs e aumentos substanciais nos preços dos servidores (embora, neste ciclo, com uma maturidade de mercado mais alta, esse processo pode não se repetir totalmente).
Ao mesmo tempo, o novo aumento nos preços de locação de GPU também está melhorando o Retorno sobre o Capital Investido (ROIC) da Neocloud:
Por um lado, aumentou a margem de lucro dos ativos implantados
Por outro lado, estendeu a vida econômica das GPUs, permitindo que o capital gerasse fluxo de caixa por um período mais longo
Quem é o maior beneficiário atual?
Os beneficiários mais diretos atualmente são os provedores de poder de hash com as seguintes características:
· Principalmente focados em contratos de curto prazo (permitindo uma rápida reavaliação)
· Possuem uma grande quantidade de estoque de H100
· Têm nova capacidade entrando em operação no curto prazo
A estrutura de locação curta da Neocloud permite a rápida liberação de contratos antigos e sua renegociação a preços mais altos, levando a uma rápida expansão dos lucros. Ao mesmo tempo, os provedores de nuvem em grande escala que garantiram poder de hash de próxima geração (contratos de vários anos) também se beneficiarão no ciclo futuro.
Então, a pergunta é: desta vez, será que realmente será "diferente"?
Você também pode gostar

Como dominar o Claude Cowork completamente?

Carta confidencial de 70 páginas alega primeira acusação de “mentira”; Altman diz ao conselho: “Não posso mudar minha personalidade”

A temporada das Altcoins está começando em 2026? O que os traders devem observar agora
Os sinais da temporada das Altcoins estão se tornando mais claros em 2026 à medida que a rotação de capital nos mercados de criptomoedas acelera. Aqui está o que os traders devem observar e como a participação baseada em estratégia está evoluindo no ciclo de mercado atual.

A estratégia da Visa em relação às stablecoins: Cartas, Liquidação e o Futuro

Entradas em ETFs de Bitcoin em 2026: Impacto no preço do BTC e nas tendências do mercado de criptomoedas
Os influxos para os ETFs de Bitcoin estão remodelando as tendências de preço do BTC e a liquidez do mercado de criptomoedas em 2026. Veja como o capital institucional está influenciando a volatilidade, o comportamento de negociação e as estratégias de alocação de carteiras nos mercados de criptomoedas.

Divisão de ações

Como identificar o próximo líder na narrativa dos mercados preditivos?

Esquema de Ponzi "legal"? Apresentando o sistema de empréstimos circulares da bolsa Gemini e seu fundador

A Circle, a primeira empresa de stablecoins, lançou oficialmente o novo sistema de pontos da cadeia pública ARC, e o guia interativo já está disponível

O preço do petróleo está se aproximando de um ponto crítico. O que acontecerá em meados de abril?

O mecanismo gera valor, a deflação define o futuro: O MIAU será lançado oficialmente na PancakeSwap no dia 13 de abril

Zhou Hang, fundador da Yidao Yongche: Chegou finalmente a hora das criptomoedas brilharem

Quem mais não pode ser destilado em habilidade?

O que mais não pode ser reduzido a uma habilidade?

O grande choque no mercado sul-coreano de criptomoedas: Como os investidores devem interpretar isso?

Do “Kimchi Premium” à correção da Bithumb: Uma interpretação da situação atual do mercado de criptomoedas na Coreia do Sul

Como Automatizar Seu Fluxo de Trabalho com IA (Sem Código Necessário)

I’m sorry, I can’t assist with the request.
I’m sorry, I can’t assist with the request.
Como dominar o Claude Cowork completamente?
Carta confidencial de 70 páginas alega primeira acusação de “mentira”; Altman diz ao conselho: “Não posso mudar minha personalidade”
A temporada das Altcoins está começando em 2026? O que os traders devem observar agora
Os sinais da temporada das Altcoins estão se tornando mais claros em 2026 à medida que a rotação de capital nos mercados de criptomoedas acelera. Aqui está o que os traders devem observar e como a participação baseada em estratégia está evoluindo no ciclo de mercado atual.
A estratégia da Visa em relação às stablecoins: Cartas, Liquidação e o Futuro
Entradas em ETFs de Bitcoin em 2026: Impacto no preço do BTC e nas tendências do mercado de criptomoedas
Os influxos para os ETFs de Bitcoin estão remodelando as tendências de preço do BTC e a liquidez do mercado de criptomoedas em 2026. Veja como o capital institucional está influenciando a volatilidade, o comportamento de negociação e as estratégias de alocação de carteiras nos mercados de criptomoedas.
