解密华为Atlas 900:数千颗昇腾910构成全球最快AI训练集群
解密华为Atlas 900:数千颗昇腾910构成全球最快AI训练集群9月18日消息(记者 赵晋杰)在9月18日开幕的华为全联接2019大会上,号称全球最快AI训练集群华为Atlas
9月18日消息(记者 赵晋杰)在9月18日开幕的华为全联接2019大会上,号称全球最快AI训练集群华为Atlas 900发布。它是如何构成的,有哪些优势,又能被应用到哪些领域,下面让我们来一一解密。
集成数千颗昇腾910AI处理器
Atlas 900 AI训练集群,由数千颗昇腾910 AI处理器互联构成,最终成为当前全球最快的AI训练集群,代表了当今全球的算力巅峰。其总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。
目前,华为已在华为云上部署了一个Atlas 900 AI训练集群,集群规模为1024颗昇腾910 AI处理器。基于当前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k数据集”,Atlas 900AI训练集群只需59.8秒就可完成训练,排名全球第一。
“ ImageNet-1k数据集”包含128万张图片,精度为75.9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70.2s和76.8s,Atlas 900 AI训练集群比第2名快15%。
Atlas 900 AI训练集群领先技术优势
首先是AI算力业界领先。Atlas 900 AI训练集群采用业界单芯片算力最强的昇腾910 AI处理器,每颗昇腾910 AI处理器内置32个达芬奇AI Core,单芯片提供比业界高一倍的算力(256TFLOPS@FP16)。其次是最佳集群网络。Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,百TB全互联无阻塞专属参数同步网络,降低网络时延,梯度同步时延缩短10~70%。此外还有系统级调优。Atlas 900 AI训练集群通过华为集合通信库和作业调度平台,整合HCCS、 PCIe 4.0 和100G RoCE三种高速接口,充分释放昇腾910 AI处理器的强大性能。最后是极致散热系统。Atlas 900 AI训练集群采用全液冷方案,创新性设计业界最强柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持高达50kW超高散热功耗,实现PUE<1.1的极致数据中心能源效率。
Atlas 900 AI 集群适用场景
Atlas 900 AI集群主要为大型数据集神经网络训练提供超强算力,可广泛应用于科学研究与商业创新,让研究人员更快地进行图像、视频和语音等AI模型训练,可被应用于探索宇宙奥秘、预测天气、勘探石油和加速自动驾驶的商用进程。
如在天文探索方面,在一张汇聚有20万颗星星的南半球星空图上,天文学家想找出某种特征的星体,需要169天的工作量。Atlas 900,只需要10秒。
-
方强:人工智能如何赋能康复医疗2019-09-19
-
华为智慧屏官图亮相:极窄边框,支持智慧跨屏功能2019-09-19
-
华为Mate30 Pro将支持四指游戏触控与AI隔空操控2019-09-19
-
华为发布企业市场下一代智能产品战略及全新+AI系列产品2019-09-19
-
跨越裂谷 选择华为云正当时2019-09-19
-
华为正式发布鲲鹏服务器主板:支持伙伴打造最强算力2019-09-19
-
金额超27亿元!华为独家中标东莞市“数字政府”建设项目2019-09-19
-
从“拼多多电视”到“华为智慧屏”,“电商+制造”的冲击才刚开始2019-09-19
-
WAIE丨软银符裔:人工智能实际是机器人的大脑2019-09-19
-
产业大咖出席WAIE上海人工智能产业大会2019-09-18
-
WAIE丨软银符裔:人工智能是机器人的大脑2019-09-18
-
WAIE丨人工智能是一次伟大的产业变革2019-09-18
-
千寻位置亮相上海WAIE人工智能产业大会2019-09-18
-
华为Watch GT 2尺寸曝光:42mm/46mm两个版本2019-09-18
-
折叠屏手机技术那么难,为什么华为、三星还要强推?2019-09-18