Início
Sobre nós
Notícias
Dinâmica do produto
Desafios da transmissão de sinais em alta velocidade enfrentados pelos data centers na era da IA
Desafios da transmissão de sinais em alta velocidade enfrentados pelos data centers na era da IA
Time 2026-04-23

Com o rápido desenvolvimento da inteligência artificial, os servidores de IA e os clusters de GPU tornaram-se a infraestrutura computacional central dos data centers. Desde o treinamento de grandes modelos de linguagem até serviços de inferência em tempo real, essas aplicações impõem exigências sem precedentes em termos de desempenho computacional e taxa de transferência de dados. Na arquitetura subjacente que sustenta esses sistemas de alto desempenho, a tecnologia de transmissão de sinais de alta velocidade enfrenta sérios desafios.

Transformação da infraestrutura impulsionada pelo aumento do poder de computação da IA

De acordo com institutos de pesquisa do setor, o mercado global de GPUs ultrapassou 40 bilhões de dólares em 2024, com uma taxa de crescimento anual superior a 30%. Um único servidor de treinamento de IA pode integrar oito ou mais GPUs de alto desempenho, formando um pool de computação unificado por meio de interconexão de alta velocidade. Essa arquitetura de computação de alta densidade impõe requisitos extremamente elevados à largura de banda de transmissão de dados e à qualidade do sinal no interior do servidor.

Enquanto isso, os sistemas de armazenamento também estão passando por uma transformação. Os sistemas tradicionais de armazenamento SATA e SAS já não conseguem atender às necessidades das cargas de trabalho de IA, e os SSDs de alta velocidade baseados no protocolo NVMe estão se tornando a tendência dominante. A nova geração CXL (Compute Express Link) Essa tecnologia aprimora ainda mais a expansão da memória e a convergência de armazenamento, permitindo que GPUs e CPUs acessem recursos remotos de memória e armazenamento de forma coerente com o cache.

PCIe 5.0: novos desafios trazidos pela duplicação da largura de banda

Como padrão dominante para a interconexão interna de dispositivos em servidores, o PCI Express (PCIe) evoluiu para sua 5ª geração e atingiu a maturidade. O PCIe 5.0 aumenta a taxa de transmissão por pista de 16 GT/s (PCIe 4.0) para 32 GT/s, duplicando a largura de banda por canal. Para placas gráficas ou adaptadores de rede em configuração x16, a largura de banda bidirecional teórica pode chegar a 128 GB/s.

No entanto, taxas de transmissão mais elevadas também trazem novos desafios de engenharia:

· Atenuação do sinal: Os sinais de alta velocidade sofrem perdas quando transmitidos através de trilhas de placas de circuito impresso (PCB) e conectores; a atenuação se agrava em frequências mais altas. Os sinais PCIe 5.0 têm uma distância efetiva de transmissão menor do que os do PCIe 4.0, exigindo um projeto de roteamento mais rigoroso.

· Integridade do sinal: Os sinais de alta velocidade são mais vulneráveis à diafonia, à reflexão e ao ruído, o que pode causar erros na transmissão de dados e prejudicar a estabilidade do sistema.

· Margem de tempo: Taxas de dados mais altas implicam janelas de tempo mais estreitas, o que impõe requisitos mais rigorosos à sincronização do relógio e à precisão das bordas do sinal.

RTecnologia etimer: a solução para a regeneração de sinais de alta velocidade

Para enfrentar os desafios da transmissão de sinais em alta velocidade, Retimador surgiu uma nova tecnologia. Um retimador é um dispositivo de regeneração de sinal instalado no caminho do sinal de alta velocidade, que detecta, recupera e reajusta a temporização de sinais atenuados para ampliar a distância efetiva de transmissão e melhorar a integridade do sinal.

Ao contrário dos amplificadores de sinal simples (redrivers), os retimers conseguem regenerar o sinal por meio dos seguintes mecanismos:

· Equalização de sinal: Compensa a atenuação nas altas frequências e restaura a amplitude do sinal.

· Recuperação de Relógio e Dados (CDR): Extraia o clock do sinal de entrada para eliminar o jitter.

· Ressincronização de sinal: Regenera sinais de dados limpos utilizando o relógio recuperado.

· Transparência do protocolo: Não analisa o conteúdo dos dados e é totalmente transparente para os protocolos de camadas superiores.

Em servidores de IA e sistemas de armazenamento de ponta, os chips retimers tornaram-se componentes essenciais para garantir uma transmissão de sinal confiável em alta velocidade. Eles desempenham um papel indispensável na interconexão entre GPUs e CPUs, bem como em conexões estendidas para SSDs NVMe.

Protocolo CXL: Redefinindo a arquitetura de computação

O CXL (Compute Express Link) é um novo protocolo de interconexão de alta velocidade baseado na camada física do PCIe 5.0, mas com funcionalidades mais avançadas. O padrão CXL 2.0 suporta três protocolos:

· CXL.io: Compatível com os protocolos PCIe para detecção e configuração de dispositivos.

· CXL.cache: Suporta a coerência do cache do dispositivo, permitindo que os dispositivos compartilhem o cache da CPU.

· CXL.memória: Suporta acesso semântico à memória, permitindo que os dispositivos acessem diretamente a memória do sistema.

O principal valor da tecnologia CXL reside na eliminação do gargalo da memória da CPU nas arquiteturas tradicionais, permitindo que aceleradores como GPUs e FPGAs acessem conjuntos de memória de grande capacidade de forma coerente com o cache. Isso é fundamental para o treinamento de IA e aplicações de big data que exigem grande quantidade de memória.

Conector MCIO: uma interface de interconexão de alta velocidade de última geração

MCIO (Mini Cool Edge IO) é um padrão de conector compacto de alta velocidade projetado para aplicações PCIe e CXL de última geração. O MCIO oferece as seguintes vantagens:

· Maior densidade: Suporta mais canais de sinal em um espaço menor.

· Melhor integridade de sinal: O layout otimizado dos pinos e o projeto de blindagem reduzem a interferência cruzada.

· Conexão por cabo: Suporta a conexão de dispositivos externos por meio de cabos, superando as limitações de espaço do chassi.

Cenários de aplicação: do treinamento de IA à computação de ponta

Clusters de treinamento em IA/ML

O treinamento de grandes modelos de IA requer a colaboração de centenas ou até milhares de GPUs. A interconexão de alta velocidade garante uma troca de dados de gradiente e parâmetros de modelo entre as GPUs com baixa latência e alta largura de banda. A tecnologia Retimer garante a integridade do sinal em backplanes complexos e cabos de longa distância.

Computação de Alto Desempenho (HPC)

Aplicações de HPC, como computação científica, simulação e sequenciamento genético, apresentam exigências extremamente elevadas em termos de largura de banda e capacidade de memória. A expansão de memória CXL, combinada com o aprimoramento de sinal por retimers, permite criar conjuntos de memória de grande capacidade e alta largura de banda para acelerar as tarefas de computação.

Jogos na nuvem e renderização em tempo real

Os servidores de jogos em nuvem virtualizam várias instâncias de GPU em uma única máquina física para fornecer serviços de renderização em tempo real a diferentes usuários. O acesso de alta velocidade ao armazenamento e à memória é fundamental para garantir experiências de jogo com baixa latência.

Armazenamento definido por software

As soluções de armazenamento definido por software (SDS) baseadas em servidores padrão precisam conectar um grande número de SSDs NVMe. As placas de expansão Retimer PCIe 5.0 permitem a expansão de SSDs em alta densidade para criar pools de armazenamento de alto desempenho.


Como escolher uma solução de expansão de sinal de alta velocidade?

Diante de exigências cada vez mais complexas em matéria de interconexão de alta velocidade, os projetistas de sistemas devem levar em consideração os seguintes fatores:

· Distância de transmissão: Avalie a distância física que os sinais precisam percorrer para determinar se é necessário utilizar o recurso Retimer.

· Configuração das faixas: Selecione os modos de bifurcação PCIe adequados (x16/x8/x4) de acordo com os requisitos do dispositivo.

· Suporte a protocolos: Verifique se é necessário o suporte ao protocolo CXL e quais são os requisitos funcionais específicos do CXL.

· Projeto térmico: Os chips retimers de alta velocidade apresentam um consumo de energia relativamente elevado e exigem soluções térmicas adequadas.

· Verificação de compatibilidade: Certifique-se de que a placa de expansão seja compatível com as placas-mãe, os sistemas operacionais e os dispositivos de destino.

Conclusão

A chegada da era da IA está remodelando o projeto da arquitetura dos data centers. Desde a transmissão em alta velocidade do PCIe 5.0 e a regeneração de sinal da tecnologia Retimer até a expansão de memória do protocolo CXL, cada tecnologia contribui para liberar o potencial da computação em IA.

Para as empresas que planejam uma infraestrutura de IA, compreender os princípios e os cenários de aplicação dessas tecnologias subjacentes ajuda a fazer escolhas tecnológicas mais racionais e a construir plataformas de computação de alto desempenho e alta confiabilidade.

Sobre a Linkreal Co., Ltd.

A Linkreal (LR-LINK) é uma empresa nacional de alta tecnologia especializada em soluções de conectividade para servidores e data centers. Seu portfólio de produtos inclui adaptadores de rede Ethernet, placas de expansão de armazenamento, soluções de expansão de GPU, etc. Acompanhando as tendências de desenvolvimento das tecnologias PCIe 5.0 e CXL, a empresa oferece soluções de expansão de sinal de alta velocidade para servidores de IA, computação de alto desempenho, armazenamento definido por software e outros cenários de aplicação.


Service
联系我们