Giới thiệu nhóm Cloud Platform tại SDSRV
Tài năng, nhiệt huyết, không ngại thử thách là đặc điểm nổi bật của những anh tài trong nhóm Cloud Platform. Dù mới thành lập nhưng nhóm đã đạt được nhiều kết quả đáng nể trong nghiên cứu & phát triển sản phẩm. Cloud Platform Cell hứa hẹn sẽ bùng nổ hơn nữa trong thời gian sắp tới.
Giới thiệu chung
Hiện nay, chi phí đầu tư cho GPU chiếm một phần đáng kể trong các khoản đầu tư hạ tầng IT của doanh nghiệp, và vẫn đang tăng lên nhanh chóng. Các tổ chức cũng cần các giải pháp lưu trữ tối ưu chi phí và các dịch vụ mạng hiệu suất cao cho các ứng dụng AI của họ. Vấn đề này có thể được giải quyết bằng các giải pháp Cloud (điện toán đám mây). Ngày càng nhiều các công ty tiến hành thử nghiệm, phát triển và chạy các ứng dụng của họ trên dựa trên các dịch vụ IaaS (Infrastructure as a service) và PaaS (Platform as a service).
Cloud Platform là một nhóm thuộc Cloud Research Lab, được thành lập vào tháng 3 năm 2022. Chúng tôi đang cộng tác với các nhà nghiên cứu tại trụ sở Samsung SDS Hàn Quốc để nghiên cứu và phát triển nền tảng PaaS tiên tiến dựa trên GPU dành cho các ứng dụng AI quy mô lớn. Để duy trì lợi thế cạnh tranh, chúng tôi thực hiện các dự án nghiên cứu để đạt được các công nghệ mới nhất cho nền tảng tính toán hiệu suất cao (HPC) dựa trên GPU; đồng thời liên tục cải thiện và phát triển các tính năng mới cho sản phẩm của mình.
Lĩnh vực nghiên cứu
- Tối ưu hóa tính toán CPU/GPU
- Công nghệ mạng hiệu suất cao
- Tính hiệu quả của điều phối lưu trữ
- Nền tảng HPC dựa trên GPU
- Các thuật toán tối ưu tài nguyên cho Data Center
Sản phẩm và công nghệ đạt được
- Sản phẩm chính của chúng tôi là x.Cloud – Nền tảng GPU dựa trên đám mây dành cho các nhà phát triển Machine Learning (học máy – ML) và Deep Learning (học sâu – DL). x.Cloud cung cấp cho các nhà khoa học dữ liệu và nhà phát triển công nghệ AI một cơ sở hạ tầng hiện đại bao gồm GPU hiệu suất cao, mạng kết nối và hệ thống lưu trữ, trong 1 giải pháp tổng thể, dễ dàng triển khai và vận hành. Chúng tôi cũng kết hợp với AI Research Lab để xây dựng các ứng dụng và dịch vụ Cloud AI cho thị trường Việt Nam như nhận diện ký tự, kiểm tra trực quan và xử lý ngôn ngữ tự nhiên
- Chúng tôi cũng đang phát triển các tính năng nâng cao trong lĩnh vực Job Scheduler. Một Job Scheduler tốt nên được thiết kế để phân phối nguồn tài nguyên hạn chế một cách hiệu quả. Bất kỳ hệ thống nào cũng đều có lúc gặp phải vấn đề khi tài nguyên yêu cầu vượt quá những gì hệ thống có thể cung cấp. Nhiệm vụ của Scheduler là quyết định cấp tài nguyên cho người dùng / job nào, cấp bao nhiêu, và khi nào. Với 1 Scheduler tốt, doanh nghiệp có thể tận dụng hiệu quả hơn tài nguyên hạ tầng mà họ đã đầu tư, đồng thời cắt giảm chi phí vận hành cũng như chi phí đầu tư trong tương lai. Chúng tôi đã tích hợp những thuật toán hiện đại trong lĩnh vực Job Scheduler vào x.Cloud, ví dụ như FIFO, Multi-Queue, Gang, Binpacking… và vẫn đang tiếp tục phát triển thêm những thuật toán mới nhất.
Thành tựu
- Nền tảng x.Cloud đang được sử dụng bởi các nhà nghiên cứu, giáo sư và sinh viên đến từ các trung tâm R&D của Samsung SDS và các phòng thí nghiệm hợp tác với các trường đại học trên thế giới.
- Đã được cấp 2 bằng sáng chế từ Văn phòng sở hữu trí tuệ Hàn Quốc về “Phương pháp cung cấp máy ảo để sử dụng tài nguyên hiệu quả”
<English version> Introduction to Cloud Platform Cell
About
Nowadays, GPU cost takes a considerable amount of corporate infrastructure investment, and it is increasing rapidly. Corporates also need cost-effective storage solutions and high-performance networking services for their ever-growing AI-based workloads. Cloud technologies can solve these problems; more and more organizations have been experimenting, developing and running applications using Infrastructure-as-a-Services and Platform-as-a-Services.
Cloud Platform is a cell of Cloud Research Lab, which was established in March 2022. We’re working in collaboration with the Samsung SDS Head Office to research and develop innovative GPU-based Platform-as-a-Service for large-scale AI applications. To maintain competitive edges, we have been conducting research projects to secure advanced technologies for a highly effective GPU-based and High-Performance Computing (HPC) Platform while simultaneously improving and developing new features for our product.
Research Areas
- CPU/GPU computing optimization
- High-performance network technologies
- Storage orchestration efficiency
- GPU-based HPC platform
- Advanced provisioning algorithms for Data Center
Products & technologies
- Our main product is x.Cloud – A Cloud-based GPU platform for deep-learning and machine-learning developers. x.Cloud offers Data Scientist and AI researchers a state-of-the-art AI infrastructure including high-performance GPUs, network and storage, all-in-one turn-key solution which is easy to setup and maintain. We’re also collaborating with AI Research Lab to build Cloud AI applications and services for Vietnamese market, such as Vision Inspection, OCR and NLP.
- We have been developing advanced features in Job Scheduler. A good scheduler should be designed to distribute constrained resources effectively. A common situation in every system is to have more requested than available resources, at times. It is the Scheduler’s responsibility to decide when, how much, and to which user / task the resource should be granted. With a good Scheduler, corporates can better utilize their invested infrastructure, hence cut costs in both operation and future investment. We have integrated modern Job Scheduler algorithms in x.Cloud such as FIFO, Multi-Queue, Gang, Binpacking, … and still developing more cutting edge ones.
Accomplishments
- x.Cloud platform which is using by researchers, professors and students from SDS R&D centers and joint labs with universities around the world.
- Received 2 patents from the Korean Intellectual Property Office on “Virtual Machine Provisioning Methods for Efficient Resource Utilization”