AI 技术的发展日渐成熟,已在多个领域实现了技术落地,应用场景也愈来愈丰富, 如语音识别、人脸识别、自动驾驶、新药研发等。这些场景数据量庞大,数据种类繁多,计算任务复杂;同时,AI 场景对计算资源的需求弹性大,对传统的HPC 架构提出新挑战。企业开始拥抱云计算,无论是私有云还是公有云,都在产生新变化。
AI 场景自身的数据特点以及基础设施的变化,都给存储带来了新的挑战:
- AI 场景读多写少,如何设计存储架构来保障数据读取性能?
- 如何提高存储平台吞吐能力,以配合成本高昂的GPU资源?
- 如何应对 AI场景中的海量小文件?
- 云环境中高性能计算平台存储方案有哪些?
本周六,我们将邀请吕冬冬,云知声超算平台架构师,同时他也是 JuiceFS 社区的活跃贡献者,是 JuiceFS Fluid Runtime 的主要贡献者, 为大家分享:云知声超算平台存储建设实践。
Juicedata 团队技术专家高昌健将为 AI 场景用户带来:如何使用 JuiceFS 为 CV 模型训练提速。
时间
2022 年11月26日(本周六)下午 14:00-15:30
活动议程
14:00-14:05 社区动态
14:05-14:35 Topic 1:云知声超算平台基于 JuiceFS 的存储实践
吕冬冬,云知声超算平台架构师,负责云知声大规模分布式机器学习平台架构设计与新功能演进,负责深度学习算法应用优化与 AI 模型加速。研究领域包括大规模集群调度、高性能计算、分布式文件存储、分布式缓存等。云原生开源社区爱好者。
演讲概要:
- Atlas 超算平台的存储建设历程
- Atlas 如何与 JuiceFS 做整合
- JuiceFS 在 Atlas 的使用场景与收益
- 云知声在开源社区的建设:参与 Fluid Runtime的开发、JuiceFS 配额功能开发
- JuiceFS 在 Atlas 的使用方式
- JuiceFS 的建设实践
- 未来的展望与规划
14:40-15:10 Topic 2:如何使用 JuiceFS 为 CV 模型训练提速
高昌健,Juicedata 技术专家,参与建设 JuiceFS 开源社区的主力队员。十年互联网行业从业经历,曾在知乎、即刻、小红书多个团队担任架构师职位,专注于分布式系统、大数据、AI 领域的技术研究。
演讲概要:
- CV 模型应用简介
- CV 模型训练的挑战
- JuiceFS 简介
- JuiceFS 如何解决 CV 模型训练的挑战
- ResNet50 测试
- 自动驾驶场景案例介绍