solu_1920x300.jpg
EZCOM Cloud Solution
이지컴아이앤씨는 클라우드 분야의 설계,구축,운용 경험을 토대로
고객사를 위한 다양한 솔루션과 테크니컬 서비스를 제공합니다.
AI, BIG-DATA
Machine Learning/Deep Learning

다중GPU기반 머신러닝 클러스터링 인프라 구축

AWS for TensorFlow GPU Cloud 

머신러닝 클러스터링 워크로드

  • 구축방안

- 다중 GPU 기반 Machine Learning Clustering PoC 사례입니다. White-list의 인가된 사용자가 VNC 서버로 접근하여 LDAP을 통해 AD 인증을 받고 Tensorflow GPU 서버로 작업을 분배합니다. 작업이 끝난 결과물은 EFS에 저장되어 열람이 가능합니다. PoC는 GPU 서버 두 대로 진행되었지만, Autoscaling 설정 시 GPU 서버가 작업에 맞게 scale-in, out이 가능합니다.

Ex) GPU Clustering for Machine Learning

AWS Cloud 환경에서 Tensorflow GPU를 클러스터링 워크로드
>