최근 몇 년간 RDMA 네트워크 카드 기술의 적용은 전 세계 이더넷 통신 시장에 큰 파장을 일으켰습니다. 특히 알리바바, 텐센트, 인스퍼, 슈퍼마이크로, 레노버 등 일부 인터넷 거대 기업들은 대량의 RDMA 서버에 장착된 네트워크 카드. 공식 데이터 보고서에 따르면, 2019년 ‘더블 11’ 기간 동안 티몰의 일일 매출액은 2,684억 위안에 달했으며, 주문 처리량 피크는 초당 54만 4,000건에 이르렀고, 단일일 데이터 처리량은 970PB에 달했다. 이 놀라운 수치가 다시 한번 등장했다. RDMA 네트워크 카드의 적용으로 이 주제가 화제의 중심에 올랐다.
하지만 많은 사용자들은 이 데이터를 보면 매우 인상적이지만, 실제 환경에서 RDMA 네트워크 카드가 어떻게 사용되는지는 잘 모르겠다고 말합니다. 사실 RDMA 네트워크 카드의 실제 적용은 모두가 생각하는 것만큼 신비롭지 않습니다. RDMA 네트워크 카드의 등장은 사실 서버 측 데이터 처리 지연을 해결하기 위한 것입니다. 다시 말해, RDMA 네트워크 카드의 임무는 CPU 부하를 줄이고, 네트워크 처리량을 향상시키며, 네트워크 지연을 줄이는 것입니다.
1. RDMA에 대하여
RDMA(Remote Direct Memory Access)는 원격 직접 메모리 액세스(Remote Direct Memory Access)를 의미하며, 처음에는 고성능 컴퓨팅 분야에 적용되었던 네트워크 통신 프로토콜로, 점차 데이터 센터에서도 널리 보급되고 있습니다. RDMA를 사용하면 사용자 프로그램이 운영 체제 커널(CPU)을 우회하여 네트워크 카드를 통해 직접 통신할 수 있으므로, 높은 대역폭과 매우 낮은 지연 시간을 제공합니다. 따라서 RDMA 네트워크 카드의 작동 원리는 기존의 TCP/IP 네트워크 카드와 비교하여, RDMA 네트워크 카드는 커널(CPU)의 개입을 생략하고 모든 데이터가 애플리케이션에서 네트워크 카드로 직접 전송된다는 점입니다.

2. RDMA의 세 가지 네트워크 프로토콜
현재 RDMA는 일반적으로 세 가지 네트워크 프로토콜: 인피니밴드, RoCE 및 iWARP
1. 인피니밴드(InfiniBand)는 RDMA에 특화된 네트워크 프로토콜로, 하드웨어 수준에서 데이터 전송의 신뢰성을 보장할 수 있습니다. 인피니밴드의 기술 사양과 표준 규격은 2000년에 공식 발표되었으나, 인피니밴드 아키텍처(IBA)는 2005년 이후 클러스터 슈퍼컴퓨터에서 널리 사용되기 시작했습니다. 개발이 더딘 가장 큰 이유는 인피니밴드가 L2부터 L4까지 자체 전용 하드웨어를 필요로 하기 때문입니다. 이에 따른 기업의 비용 부담이 매우 큽니다. 현재 주요 인피니밴드 네트워크 제조사는 멜라녹스(Mellanox)입니다.
2. RoCE는 이더넷에서 RDMA를 구현할 수 있게 해주는 네트워크 프로토콜입니다. RoCE v1과 RoCE v2로 나눌 수 있습니다. 많은 네티즌들은 RoCE의 하위 네트워크 헤더가 이더넷 헤더이고 상위 네트워크 헤더가 인피니밴드(InfiniBand) 헤더이기 때문에, RoCE의 아키텍처 자체가 인피니밴드에서 차용된 것이라고 생각합니다. 이는 시장 수요를 충족하기 위해 멜라녹스(Mellanox)가 출시한 저비용 인피니밴드 네트워크(RoCE v1 지원)입니다.
RoCE 네트워크는 저지연 운영을 위해 무손실 이더넷이 필요하며, 이는 무손실 트래픽을 유지하기 위해 네트워크에 통합된 이더넷 스위치가 데이터 센터 브리징(DCB) 및 우선순위 흐름 제어(PFC) 메커니즘을 지원해야 함을 의미합니다. 그러나 무손실 이더넷의 어려움은 현대적인 기업 환경에서 구성이 복잡한 과정이며 확장성이 크게 제한된다는 점이지만, 이는 재정적 여력이 충분한 기업에게는 문제가 되지 않습니다. 둘째, RoCE는 랙 서버나 호스트의 네트워크 카드를 직접 사용할 수 있습니다.
3. iWARP는 TCP 환경에서 RDMA를 실행할 수 있게 해주는 네트워크 프로토콜입니다. 이 프로토콜의 장점은 현재의 표준 TCP/IP 네트워크에서 바로 사용할 수 있다는 점입니다. RDMA를 사용하려면 iWARP를 지원하는 네트워크 카드를 별도로 구매해야 합니다. 예산이 다소 제한적인 기업에게 특히 적합합니다. 하지만 성능 면에서는 RoCE보다 약간 뒤떨어진다는 단점이 있습니다. 결국, 값을 치르면 그에 상응하는 대가를 얻는 법입니다. 이 원칙은 예로부터 적용되어 온 것입니다.
3. RDMA 네트워크 카드 브랜드를 선택하는 방법
속담에 “여러 곳을 둘러보고 비교해 보라”는 말이 있듯이, RDMA 네트워크 카드 브랜드를 선택할 때도 마찬가지입니다. 전 세계 시장을 살펴보면, 현재 RDMA 네트워크 카드 제조사로는 마벨(Marvell), 인텔(Intel), 멜라녹스(Mellanox) 등 세 가지 주요 브랜드가 있습니다. 그중 마벨은 퀄로직(Qlogic)을 인수한 브랜드이며, 멜라녹스는 엔비디아(NVIDIA)에 인수된 기업입니다.
RDMA 네트워크 카드 제조사를 어떻게 선택해야 할까요? 우선, Mellanox의 Infiniband 네트워크가 RDMA 네트워크 카드 성능을 가장 잘 대표한다는 점을 알고 있습니다. 이는 하드웨어 전송을 통해 신뢰성을 보장할 수 있지만, 전체 생태계에 전용 하드웨어가 갖춰져야 한다는 단점이 있습니다. 이더넷을 지원하는 RDMA 네트워크 카드가 출시되기는 했지만, 이 RDMA 네트워크 카드는 RoCE v1만 지원하며, 이는 스위치에서 우선순위 흐름 제어(PFC) 메커니즘을 충족해야 하므로 비용이 많이 듭니다. 이 때문에 대부분의 데이터 센터 기업들은 이를 채택하지 못하고 있습니다.
이제 RoCE v2와 iWARP만 남았습니다. 인텔은 주로 CPU 처리를 담당하는 미국 기업입니다. RDMA 성능(RoCE v2 및 iWARP 프로토콜)은 이미 800 시리즈 이더넷 컨트롤러에서 지원되고 있습니다. RoCE v2는 RoCE v1의 업그레이드 버전입니다. 가장 큰 개선점은 IP 라우팅을 지원한다는 점입니다. iWARP 프로토콜의 가장 큰 특징은 어떤 IP 네트워크에서도 실행될 수 있으며, 더 이상 관련 하드웨어 지원 장비의 호환성을 제한하지 않는다는 점입니다. 이러한 관점에서 볼 때, 인텔과 멜라녹스(Mellanox)의 RDMA 네트워크 카드는 생태계 호환성이 더 뛰어나고 비용 효율적입니다.
앞서 언급했듯이, Marvell은 Qlogic 브랜드를 인수한 기업입니다. Qlogic 브랜드는 파이버 채널 시장에서 절대적인 영향력을 가지고 있습니다. 전 세계 수많은 기업 고객들이 Qlogic의 솔루션을 도입하고 있습니다. RDMA와 관련하여, 퀄로직과 인텔은 RoCE와 iWARP에 동등한 관심을 기울이고 있습니다. iWARP에 대한 편견은 없습니다. 고객은 동일한 어댑터에서 RoCE와 iWARP 프로토콜을 모두 사용할 수 있지만, 마벨은 이더넷 네트워크 컨트롤러를 내년에 단종할 것이라고 발표했습니다. 이는 매우 유감스러운 소식입니다.
4. 중국 기업들이 자체적으로 RDMA 네트워크 카드 제조사를 연구 개발하고 있다
앞서 언급한 세 거대 기업 외에도 여전히 많은 기업이 있습니다 RDMA 네트워크 카드 중국 내 강력한 자체 연구개발 역량을 갖춘 제조사들, 예를 들어 심천 리안루이 전자 유한공사(Shenzhen Lianrui Electronics Co., Ltd.) 등이 있습니다. 2019년, 심천 리안루이 전자 유한공사(이하 LR-LINK 리안루이)는 마벨(Marvell)과 전략적 파트너십을 체결했습니다. 파이버 채널 분야에서 Qlogic의 강력한 역량을 바탕으로, 서버 분야 전용 RDMA 네트워크 카드를 개발했습니다. 주요 제품은 듀얼/쿼드 포트 10기가비트 네트워크 카드(모델: LRES1004PF-2SFP+, LRES1005PF-4SFP+), 25G 서버 네트워크 카드, 10기가비트 및 25G OCP 3.0 네트워크 카드등. 마벨(Marvell) 이더넷 네트워크 컨트롤러가 내년에 단종될 예정이므로, 현재 LR-LINK Lianrui의 기존 마벨 네트워크 카드(RDMA 기능)는 주로 기존 고객들이 주문하는 제품입니다.
또한, 2020년 6월 이후 LR-LINK Lianrui는 인텔 800 시리즈를 기반으로 한 이더넷 카드 어댑터를 자체 개발하기 시작했습니다. 현재 정상적으로 판매되고 있는 제품은 100G 듀얼 광포트 서버 네트워크 카드, 100G 싱글 광포트 서버 네트워크 카드, 25G 듀얼 광포트 서버 네트워크 카드이며, 현재 연구 개발 단계에 있는 제품은 25G 4광포트 서버 네트워크 카드, 25G 듀얼 광포트 OCP 3.0 네트워크 카드 및 100G 듀얼 포트 OCP 3.0 네트워크 카드 등이 있으며, 이들 모두 성능 면에서 낮은 지연 시간과 높은 네트워크 처리량을 자랑합니다. 또한 대용량 처리, CPU 오버헤드 절감, RDMA 기능 지원 등 뛰어난 특징을 갖추고 있습니다.
앞으로 기업 분야의 데이터 센터 데이터 처리 수요가 급증함에 따라, LR-LINK는 업계 내 강점을 지속적으로 활용하여 고성능, 고대역폭, 저지연 등의 특성을 갖춘 네트워크 카드를 지속적으로 혁신하고 개발해 나갈 것이며, 전 세계 고객에게 뛰어난 성능의 전문 네트워크 카드 솔루션을 제공하기 위해 끊임없이 노력할 것입니다.