김재호 기자
AI·데이터 인프라 솔루션 전문기업 HS효성인포메이션시스템이 자율주행 차량용 AI 비전 인식 기술 기업 스트라드비젼의 ‘AI 데이터 레이크 고도화’ 사업을 성공적으로 지원하며 AI 학습·검증 환경의 성능과 운영 효율을 대폭 개선했다고 밝혔다.
스트라드비젼은 전 세계 고객사 차량에서 수집되는 실제 주행 데이터를 기반으로 데이터 수집부터 AI 모델 학습·검증까지 전 과정을 아우르는 자체 AI 데이터 파이프라인을 운영하고 있다.
HS효성인포메이션시스템 ‘AI 데이터 레이크 고도화’로 스트라드비젼 데이터 학습·검증 효율 개선
사업 확장에 따라 매년 수 페타바이트(PB) 규모로 증가하는 주행 데이터와 AI 모델 고도화, 고객사별 맞춤형 모델 수요에 대응하기 위해 데이터 처리 성능과 인프라 확장성에 대한 요구가 지속적으로 증가해 왔다. 특히 대규모 실제 주행 데이터가 집중적으로 활용되는 AI 학습·검증 환경에서 안정성, 생산성, 확장성을 동시에 확보할 수 있는 인프라 구축이 핵심 과제로 떠올랐다.
이에 HS효성인포메이션시스템은 스트라드비젼의 데이터 레이크 확장을 위한 AI 인프라 고도화 프로젝트를 추진하고, 대용량 비정형 데이터 처리와 고성능 GPU 분석 환경을 안정적으로 지원할 수 있는 핵심 스토리지 솔루션을 도입했다.
먼저 오브젝트 스토리지 ‘HCP(Hitachi Content Platform)’를 적용해 기존 클라우드에서 수행하던 대규모 비정형 데이터 처리를 온프레미스 환경에서도 가능하도록 설계했다. 이를 통해 동일한 워크로드를 클라우드 대비 약 30% 낮은 비용으로 운영할 수 있는 환경을 구현했으며, 스케일아웃 구조를 기반으로 총소유비용(TCO) 절감과 함께 장기적인 확장성을 확보했다.
또한, GPU 기반 AI 학습·검증 과정에서 발생하던 스토리지 병목 현상을 해소하기 위해 고성능 올플래시 NAS 스토리지 ‘VSP One File’을 도입했다. 다수의 개발자와 엔지니어가 동시에 대규모 데이터셋에 접근하는 환경에서도 고속 데이터 처리와 안정적인 파일 공유가 가능하도록 구성해 GPU 연산 자원의 활용 효율을 극대화했다. 그 결과 기존 스토리지 대비 최대 10배 이상의 데이터 처리 성능을 구현했으며, 솔루션 도입 후 불과 1주일 만에 GPU 사용률이 10% 이상 증가하는 성과를 거뒀다.
김인수 스트라드비젼 데이터 이노베이션 센터장은 “이번 데이터 레이크 고도화를 통해 AI 모델 개발과 검증 속도를 한층 끌어올리고, 글로벌 고객사의 요구에 보다 민첩하게 대응할 수 있는 기반을 마련했다”며, “단순한 인프라 공급을 넘어 스트라드비젼 환경에 최적화된 설계와 기술을 제공한 HS효성인포메이션시스템과의 협업을 통해 안정성과 확장성을 모두 갖춘 AI 인프라를 구축할 수 있었다”고 말했다.
양정규 HS효성인포메이션시스템 대표는 “AI 시대의 경쟁력은 데이터를 얼마나 안정적이고 효율적으로 활용할 수 있느냐에 달려 있다”며, “앞으로도 스트라드비젼과 같은 AI 기업의 지속적인 성장을 지원하기 위해 중장기 관점에서 인프라 전략을 함께 고민하는 파트너로서 역할을 강화해 나가겠다”고 밝혔다.
[경제엔미디어=김재호 기자]