客户介绍
联想AI研究院致力于推动人工智能、机器学习、语音与视觉识别等技术的发展,研究领域包括 Edge AI、炼AI大师、语音技术、计算机视觉、机器学习与智能数据、自然语言处理与知识图谱,24 年共发布 7 款 PCAI 产品。
AI 业务主要包含重 GPU、重 CPU 的两大算力场景,且两大算力场景共享同一套存储支撑平台。存储支撑平台作为核心底层架构,承接了 7 个业务部门的存储虚拟化需求。
面临挑战
研究院原使用 Redhat 旗下存储产品来构建存储平台,由于 RedHat 是订阅服务,面临服务响应不及时、成本过高、合规性三大挑战。
重 CPU 算力场景,研究院联想自研的计算虚拟化平台,平台产品缺乏研发人员、产品迭代慢、稳定性持续得不到解决;
重 GPU 算力场景,直接基于物理服务器+ GPU 来承载 AIGC 资源池,为上层模型服务器提供算力支持。
对存储平台稳定性及性能要求较高。
方案介绍
采用 UCloudStack 私有云和 UCloudStor 统一分布式存储平台作为 CPU 算力池及数据存储底座支撑。
UCloudStor 适配多种应⽤接口,不绑定硬件资源,提供多种数据服务,促进业务互联互通,打破数据调度壁垒。
全冗余架构设计,服务高可用,资源智能调度,数据多副本存储,为研究院提供高效稳定、安全可靠的运行环境。
项目收益
产品兼容性高,不绑定硬件,充分利旧库房闲置硬件资源
私有云及云存储均为永久授权,相比 RadHat 订阅模式,成本得到大幅优化。
比 RadHat 工单模式售后服务更加及时高效,安全合规,大幅提升设施运维效率,符合当前发展需要。
统一存储平台很好的支持了 CPU & GPU 算力池的高性能存储需求。