英 반도체 업체 그래프코어, AI 기업 허깅페이스와 파트너십 체결

강하늘 승인 2021.09.18 12:09 의견 0

인공지능(AI) 반도체 기업인 그래프코어가 오픈소스 인공지능(AI) 분야의 허깅페이스와 파트너십을 체결했다.

그래프코어는 허깅페이스의 ‘하드웨어 파트너 프로그램’에 참여, 머신 인텔리전스 혁신 가속화란 양사의 공동 목표를 실현해 나갈 예정이다.

 

이로써 개발자들은 허깅페이스 하드웨어 파트너 프로그램을 통해 최소한의 코딩으로 그래프코어 IPU에 최적화된 SOTA(State-of-the-Art) 트랜스포머 모델을 생산 규모로 구현할 수 있게 됐다. 

 

 

IPU는 그래프코어의 데이터센터 컴퓨팅 시스템 IPU-POD의 기초가 되는 프로세서로, 특히 AI와 머신러닝(ML)에 요구되는 고유의 컴퓨팅 사양을 지원하도록 설계됐다. 세분화된 병렬 처리, 저정밀도 연산, 희소성 처리 능력과 같은 특성을 갖는다.

그래프코어 IPU는 GPU와 같은 SIMD/SIMT 아키텍처 대신, 실리콘 다이(die) 바로 위 프로세서 코어에 인접한 초고대역폭 메모리와 함께 대규모 병렬 MIMD 아키텍처를 사용한다. 이러한 설계는 BERT나 이피션트넷(EfficientNet)과 같이 오늘날 가장 널리 사용되는 모델의 구동은 물론, 차세대 AI 애플리케이션 탐색을 위한 획기적인 성능과 효율성을 제공한다.

그래프코어는 IPU 기능 극대화에 있어 소프트웨어의 중요성을 강조해왔다. 그래프코어는 창사 이래 모든 프로세서와 자사 소프트웨어 포플러(Poplar) SDK를 공동 설계하며 개발자들이 가장 많이 사용하는 타사 시스템과 호환이 가능하도록 했다.

 

개발자는 다른 컴퓨팅 플랫폼에서도 모델을 쉽게 포팅(port)해와 IPU의 성능적 이점을 활용할 수 있다. 현재 포플러 SDK는 파이토치와 텐서플로우를 포함한 표준 머신러닝 프레임워크와 도커 및 쿠버네티스와 같은 오케스트레이션 및 배포 툴과 완전히 통합된다. 

그래프코어 고객들은 BERT와 같은 모델을 자연어 처리(NLP) 이상의 다양한 애플리케이션에 걸쳐 광범위하게 사용하고 있으며 이러한 모델은 특징 추출, 텍스트 생성, 감정 분석, 번역을 포함한 다양한 기능을 수행해내고 있다.

허깅페이스는 이미 프랑스 언어 CamemBERT를 비롯해 NLP에서 얻은 통찰을 컴퓨터 비전에 적용하는 ViT 등을 포함한 수백 개의 트랜스포머를 보유 중이다. 허깅페이스의 트랜스포머 라이브러리는 월평균 2백만 다운로드를 기록하고 있다. 그 수요가 계속 증가하고 있는 가운데 허깅페이스는 이번 파트너십 체결을 통해 최상의 트랜스포머 툴세트를 그래프코어의 최첨단 AI 하드웨어와 결합시키며, AI 혁신 가속화에 속도를 낼 전망이다.

개발자들은 새로운 오픈소스 라이브러리 및 툴킷인 옵티머스(Optimus)를 사용해 허깅페이스 인증을 거친 하드웨어 최적화 모델을 활용할 수 있게 된다. 양사는 긴밀한 협업을 통해 해당 모델을 공동 개발 중이며, 올해 말 그래프코어 IPU에 최적화된 첫 모델을 선보일 예정이다. 또한 개발 중인 모델은 시각, 음성, 번역, 텍스트 생성 등 광범위한 응용 분야에 적용될 것으로 기대된다.
 
그래프코어는 이미 파이토치로 그래프코어에 최적화된 허깅페이스 BERT를 구현해 SOTA 트랜스포머 모델을 가속화하는 IPU의 위력을 입증한 바 있다.

 

특히 그래프코어 시스템으로 구현한 BERT는 벤치마크에서 GPU 대비 극적인 결과를 냈다. 최고의 효율성을 자랑하는 그래프코어 IPU는 학습 시간은 단축시키는 동시에 모델 개발 시 더 많은 학습 반복을 가능케 하며 머신러닝 연구 및 엔지니어링의 판도를 바꾸고 있다.

그래프코어는 허깅페이스와의 이번 협력을 통해 보다 많은 개발자들이 트랜스포머의 가능성을 체험할 수 있도록 지원을 아끼지 않으며, AI 혁명을 이끌어 간다는 계획이다. [플랫폼뉴스 강하늘 기자]
 
■ 그래프코어
그래프코어는 현재와 차세대 인공지능 워크로드에 최적화된 반도체인 지능처리장치(Intelligence Processing Unit; IPU)를 개발한 영국 기업이다. 

 

그래프코어의 IPU는 현존하는 마이크로프로세서 중 가장 정교한 설계를 자랑한다. 그래프코어의 콜로서스 GC200 IPU 4개로 가동되는 IPU-M2000은 1U 블레이드에 1페타플롭 AI 연산 성능을 탑재했다. 그래프코어의 IPU 시스템은 다양한 AI 연산과 추론 태스크에서 최신 GPU 기반의 시스템보다 확연히 월등한 성능을 보이고 있다.

 

대규모 배치를 위한 그래프코어의 IPU-POD64는 최대 64개의 IPU 프로세서 병렬 처리로 대규모 모델 연산을 처리할 수 있으며 다수의 사용자와 태스크 간에 컴퓨팅 리소스를 공유할 수 있다.

 

엑사스케일 컴퓨팅의 경우 IPU-POD 구성으로 최대 6만 4천개의 IPU를 연결해 사용할 수 있다. 2016년 창립한 그래프코어는 현재까지 7억 1천만 달러 이상의 투자를 유치한 바 있다.

 

저작권자 ⓒ 플랫폼뉴스, 무단 전재 및 재배포 금지