
레드햇·리벨리온, NPU 기반 오픈시프트 AI 공개
레드햇(Red Hat)이 국내 AI 반도체 스타트업 리벨리온(Rebellions)과 협력해 ‘리벨리온 NPU 기반 레드햇 오픈시프트 AI(Red Hat OpenShift AI powered by Rebellions NPUs)’를 공식 발표했다.
이번 발표는 GPU 중심으로 고착화된 엔터프라이즈 AI 인프라 구조에서 벗어나, 에너지 효율과 비용 효율을 동시에 고려한 새로운 추론 아키텍처를 제시했다는 점에서 업계의 주목을 받고 있다.
GPU 중심 AI 인프라의 한계와 새로운 대안
기업들이 생성형 AI와 대규모 언어 모델(LLM)을 실제 업무 환경에 적용하면서 인프라 비용, 전력 소모, 배포 복잡성은 핵심 과제로 떠올랐다.
기존 GPU 중심 구조는 높은 성능을 제공하지만, 대규모 추론 환경에서는 전력·냉각 비용 증가와 자원 확보 문제가 동시에 발생한다.
레드햇과 리벨리온은 이러한 문제의 대안으로 “추론에 특화된 NPU 기반 엔터프라이즈 AI”라는 방향성을 제시했다.
리벨리온 NPU, 추론 중심 아키텍처로 효율 극대화
리벨리온의 NPU(Neural Processing Unit)는 학습보다는 AI 추론에 최적화된 구조로 설계됐다.
GPU 대비 높은 에너지 효율을 제공하며, 서버·랙 단위에서 전력 소비를 줄여 데이터센터 전체의 총소유비용(TCO)을 낮추는 것이 강점이다.
동일한 추론 성능 대비 전력 효율을 크게 개선하는 데 초점을 둔다.
Red Hat OpenShift AI와 vLLM 결합
이번 솔루션은 단순히 하드웨어 결합에 그치지 않는다.
레드햇 오픈시프트 AI 플랫폼 위에서 리벨리온 NPU와 고성능 추론 엔진 vLLM을 결합해 모델 서빙부터 운영까지 아우르는 검증된 풀스택 AI 추론 환경을 제공한다.
이를 통해 기업은 기존 GPU 기반 개발 경험을 유지하면서도 NPU 기반 추론 환경으로 자연스럽게 확장할 수 있다.
멀티클라우드·온프레미스 환경까지 확장
리벨리온 NPU 오퍼레이터는 레드햇 오픈시프트 인증을 획득해 온프레미스, 프라이빗 클라우드, 멀티클라우드 환경에서 안정적인 통합을 지원한다.
이는 데이터 주권과 규제 준수가 중요한 금융·공공·제조 분야에서 특히 중요한 요소로 평가된다.
“모든 모델·모든 가속기·모든 클라우드” 전략 강화
브라이언 스티븐스(Brian Stevens) 레드햇 AI 부문 수석부사장은 이번 협업이 레드햇의 핵심 전략을 실질적으로 확장하는 사례라고 강조했다.
다양한 모델과 가속기, 클라우드 환경을 선택할 수 있어야
엔터프라이즈 AI는 지속 가능하다.
레드햇은 개방형 플랫폼인 오픈시프트 AI를 중심으로 GPU, NPU, 향후 다양한 가속기를 유연하게 수용하는 구조를 계속 확대할 계획이다.
엔터프라이즈 AI 추론 시장에 던지는 의미
이번 발표는 단순한 협업을 넘어, 엔터프라이즈 AI 인프라가 학습 중심에서 추론 중심으로 이동하고 있음을 보여준다.
특히 비용·전력·확장성이 중요한 실제 운영 환경에서 NPU 기반 AI 추론은 GPU를 보완하거나 대체하는 현실적인 선택지로 부상하고 있다.
레드햇과 리벨리온의 협업은 “AI를 실험이 아닌 운영으로 가져가기 위한 인프라의 방향”을 제시하는 사례로 평가된다.
'IT 소식 뉴스 > IT 소식' 카테고리의 다른 글
| Windows 11 사용자 GeForce 드라이버 즉시 업데이트 필요성 (0) | 2025.12.14 |
|---|---|
| CATRA 리스크신뢰평가 (0) | 2025.12.14 |
| 태니엄, CVE 공식 CNA 지정…취약점 번호 직접 발급 (0) | 2025.12.14 |
| 2026 ISMS·ISMS-P 변경 사항 (0) | 2025.12.14 |
| CISA, WinRAR 취약점 적극 악용 확인 (0) | 2025.12.14 |
