banner
홈페이지 / 소식 / 자일링스, Versal HBM 출시
소식

자일링스, Versal HBM 출시

Sep 26, 2023Sep 26, 2023

우리가 데이터에 빠져 있다는 것은 비밀이 아닙니다. 오늘날의 애플리케이션과 알고리즘에는 거의 이해할 수 없을 만큼 많은 양의 데이터가 필요합니다. 이는 대역폭 요구 사항이 네트워킹 및 메모리 기술이 처리할 수 있는 것보다 더 빠르게 폭발하고 있음을 의미합니다. FPGA로 구축할 수 있는 가장 진보된 가속기를 사용하더라도 칩 안팎으로 데이터를 가져오거나 처리하는 동안 정보를 저장할 장소를 찾는 데 어려움을 겪을 수 있습니다.

메모리 대역폭이 급격히 증가하고 있음에도 불구하고 수요는 더욱 빠르게 증가하고 있습니다. 전 세계적으로 제타바이트에 달하는 정보를 퍼뜨리는 과정에서 현재 기술이 한계점에 도달했습니다. 시스템에 메모리 대역폭이 부족한 경우 성능이 중요한 작업을 FPGA로 미루는 것은 도움이 되지 않습니다.

동시에, 점점 더 많은 데이터를 보호해야 하며 데이터가 인터페이스를 통해 이동할 때마다 취약해집니다.

우리에게 필요한 것은 메모리를 처리에 더 가깝게 옮기는 것입니다.

Xilinx는 새로운 Versal HBM 시리즈 "ACAP" 장치(우리는 이를 FPGA라고 생각함)를 통해 메모리 현지화를 향한 큰 발걸음을 내디뎠습니다. HBM(또는 고대역폭 메모리)은 다른 처리 요소와 동일한 패키지에 배치되도록 설계되었으며 SSI(Stacked Silicon Interconnect) 고급 패키징 기술을 통해 통신합니다. 메모리를 패키지 내로 유지함으로써 훨씬 더 높은 대역폭 연결이 가능하며 오프칩 메모리 인터페이스를 피하면 전력 소비와 인터페이스 대기 시간이 크게 줄어듭니다.

이는 Xilinx의 SSI 첫 로데오와는 거리가 멀습니다. 이 회사는 몇 년 전 FPGA를 사용한 실리콘 인터포저 분야의 선구자였으며 이 새로운 장치는 4세대 SSI를 기반으로 구축되었습니다. 초기에 SSI는 더 큰 FPGA를 구축하기 위해 여러 개의 작은 FPGA 칩렛을 단일 패키지로 패키징하여 효과적인 수율을 높이는 데 주로 사용되었습니다. 그러나 오늘날 SSI는 Xilinx의 실리콘을 더욱 확장 가능하고 다용도로 만드는 데에도 사용됩니다. 예를 들어 Versal HBM을 구축하기 위해 Versal Premium 장치에서 HBM2e 스택용 "SLR(수퍼 로직 영역)" 칩렛 하나를 교체하여 Versal HBM을 구축했습니다. (좋아, 그것보다 조금 더 복잡하지만 아이디어를 얻을 수 있습니다.)

외부 DDR5와 비교하여 패키지 내 HBM은 63% 더 낮은 전력으로 8배의 대역폭을 제공합니다. 그리고 그것은 큰 문제입니다. FPGA 내부에 HBM 스택을 배치하면 처리를 위한 전력 예산을 절약하는 동시에 메모리 대역폭의 대박을 얻을 수 있습니다.

Xilinx가 자사 장치 중 하나에 HBM을 적용한 것은 이번이 처음이 아닙니다. 이전 세대 Virtex Ultrascale+ FPGA의 한 버전은 패키지 내 HBM을 특징으로 합니다. 그러나 새로운 Versal HBM은 15% 더 낮은 전력에서 1.8배의 메모리 대역폭(460Gbps ~ 820Gbps)과 2배의 HBM 메모리 용량(32GB 대 16GB)으로 모든 축에서 HBM보다 성능이 뛰어납니다.

Versal HBM은 단순히 더 많은 메모리 대역폭 이상의 기능을 제공합니다. 또한 장치에 데이터를 넣고 빼기 위한 SerDes 파이프의 크기를 크게 늘려 총 대역폭을 놀라운 5.6Tb/s로 두 배 늘렸습니다. SerDes는 전력 최적화된 100G 인터페이스를 위한 32Gbps NRZ, 현재 400G 램프 및 배포를 위한 58Gbps PAM4, 레인당 100G 광학에서 향후 800기가 네트워크 개발을 위한 매우 스포티한 112Gbps PAM4를 통해 최대 애플리케이션 유연성을 위해 확장 가능합니다.

다중 속도를 제공하는 2.4Tb/s의 확장 가능한 이더넷 대역폭(FEC 포함 400/200/100/50/40/25/10G) 및 다중 표준: FlexE를 포함하여 많은 표준 인터페이스가 사전 구축 및 강화되어 있습니다. Flex-O, eCPRI, FCoE 및 OTN. 대량 암호화 AES-GCM-256/128, MACsec, IPsec을 통해 제공되는 1.2Tb/s의 회선 속도 암호화 처리량으로 보안을 빠르게 수행할 수 있습니다. Xilinx는 이것이 "적응 가능한 플랫폼에서 세계 유일의 강화된 400G 암호화 엔진"이라고 주장합니다.

PCIe가 당신의 잼이라면 Versal HBM은 DMA, CCIX 및 CXL을 갖춘 PCIe Gen5를 통해 1.5Tb/s의 통합 PCIe 링크 대역폭을 제공합니다(예, 현재 두 팀 모두에서 플레이 가능). PCIe 인터페이스에는 프로그래밍 가능한 NoC(네트워크 온 칩)를 통해 메모리에 대한 전용 연결이 있습니다.

따라서 Versal HBM은 칩 안팎으로 데이터를 가져오고 칩이 있는 동안 메모리에 보관하는 훌륭한 작업을 확실히 수행할 수 있습니다. 하지만 실제 업무를 수행하는 능력은 어떻습니까?