미국에 기반을 둔 스타트 업인 Cerebras Systems는 1 조 2 천억 개 이상의 트랜지스터를 통합 하고 크기가 46,225 제곱 밀리미터 인 가장 큰 칩을 출시했습니다. 새로운 Cerebras Wafer Scale Engine (WSE) 칩은 AI에 최적화 되어 있으며 815 평방 밀리미터를 측정하고 211 억 개의 트랜지스터를 포함하는 가장 큰 그래픽 처리 장치보다 56.7 배 더 큽니다. 새로운 Cerebras Wafer Scale Engine (WSE)은 3,000 배 더 많은 고속 온칩 메모리를 제공하고 10,000 배 더 많은 메모리 대역폭을 제공합니다. 더 큰 크기의 칩은 정보가 더 빨리 처리 될 수 있도록 보장하고 연구자들이 더 많은 아이디어를 테스트하고 더 많은 데이터를 사용하며 새로운 문제를 해결할 수 있도록하는 "인식 시간"또는 "훈련 시간"을 줄일 수 있습니다.
Cerebras WSE는 AI를 위해 설계되었으며 십자 레티클 연결, 수율, 전력 공급 및 패키징과 같은 제한된 칩 크기 인 수십 년 된 기술 문제를 해결하여 최첨단 기술을 발전시키는 근본적인 혁신을 포함합니다. WSE는 계산 및 통신을 가속화하여 교육 시간을 단축 할 수 있습니다. WSE는 가장 큰 그래픽 처리 장치보다 56.7 배 더 많은 실리콘 면적을 가지고 있습니다. 또한 WSE는 더 많은 계산을 수행하기 위해 더 많은 코어를 제공하고 코어에 더 가까운 메모리를 제공하므로 코어가 효율적으로 작동 할 수 있습니다. 방대한 배열의 코어와 메모리가 단일 칩에 내장되어 있기 때문에 모든 통신은 실리콘 자체에 유지됩니다.
Cerebras WSE 칩은 46,225mm2의 실리콘을 포함하고 400,000 개의 AI 최적화, 캐시 없음, 오버 헤드 없음, 컴퓨팅 코어 및 18GB의 로컬 분산 초고속 SRAM 메모리를 포함합니다. 이 칩은 초당 9 페타 바이트의 메모리 대역폭과 함께 제공되며, 코어는 초당 100 페타 비트의 총 대역폭을 제공하는 세분화 된 전체 하드웨어 온칩 메시 연결 통신 네트워크와 함께 연결됩니다. 즉, WSE의 저 지연 통신 대역폭이 매우 커서 코어 그룹이 최대의 효율성으로 협업 할 수 있으며 메모리 대역폭이 더 이상 병목 현상이되지 않습니다. 더 많은 로컬 메모리, 더 많은 코어 및 낮은 대기 시간의 고 대역폭 패브릭이 결합되어 AI 작업을 가속화하기위한 최적의 아키텍처를 형성합니다.
Cerebras WSE 칩의 특징:
- 코어 증가: WSE는 프로그래밍 가능하고 유연하며 모든 신경망 계산을 뒷받침하는 희소 선형 대수에 최적화 된 SLAC (Sparse Linear Algebra Cores)라고하는 400,000 개의 AI 최적화 컴퓨팅 코어를 통합합니다. SLAC의 프로그래밍 기능은 코어가 끊임없이 변화하는 기계 학습 분야에서 모든 신경망 알고리즘을 쉽게 실행할 수 있도록합니다. WSE 코어는 딥 러닝과 같은 희소 워크로드 (0이 포함 된 워크로드)에 대한 계산 성능을 가속화하는 Cerebras에서 발명 한 희소성 수확 기술을 통합합니다.
- 향상된 메모리: Cerebras WSE는 더 적은 대기 시간과 적은 에너지로 유연하고 빠른 계산을 가능하게하는 어떤 칩보다 많은 코어와 함께 더 많은 로컬 메모리를 통합합니다. WSE는 한 클럭 주기로 코어에서 액세스 할 수있는 18GB (기가 바이트)의 온칩 메모리와 함께 제공됩니다. 이 코어-로컬 메모리 모음을 통해 WSE는 초당 9 페타 바이트의 총 메모리 대역폭을 제공합니다. 이는 메모리 대역폭이 10,000 배, 메모리 대역폭이 3,000 배 증가합니다.