레드햇이 기업들이 생성형 AI를 보다 효과적으로 활용할 수 있도록 AI 인퍼런스 서버를 선보인다고 21일 밝혔다.레드햇 AI 인퍼런스 서버는 오픈소스 vLLM 프로젝트에 기반해 멀티클라우드 환경에서 AI 추론을 지원한다.vLLM은 연속 배칭, GPU 다중 지원, 대형 컨텍스트 입력을 지원하는 추론 엔진으로, 라마, 제미나이, 파이 등 여러 모델 개발사들이 활용하고 있다.레드햇은 이를 컨테이너화해 기업 환경에서 최적화된 AI 추론을 제공하며, 뉴럴매직