华为昇腾910联手阿里含光800摆开“地表最强芯”的大幕 _ 东方财富网

当下这个阶段,假如你的芯片没有一个某某功能最强的标志,那么规劝你不要来国产芯片发布的圈子凑热闹。现在,这儿是“地表最强”芯片的舞台。

8月23日,华为在深圳总部推出AI处理器Ascend 910(昇腾910)。华为轮值董事长徐直军表明,昇腾910整体技能体现超出预期,作为算力最强AI处理器,名副其实。

无独有偶。9月25日,杭州云栖大会上,达摩院院长张建锋现场展现了最强的AI推理芯片含光800。张建锋表明,在业界规范的ResNet-50测试中,含光800推理功能到达78563 IPS,比现在业界最好的AI芯片功能高4倍;能效比500 IPS/W,是第二名的3.3倍。

看到这儿,咱们发现阿里、华为关于“最”字的运用是不是过于随意了?这看起来更像是文字游戏,之后一切在某一范畴优秀的芯片都可以用这样的方法冠以“地表最强”的称谓。

但咱们无力辩驳。昇腾910确实是现在算力最强的AI芯片,而含光800也确实是现在AI推理可以力最强的芯片。

无论如何,昇腾910和含光800在我国芯片进程上都有着自己杰出的奉献,在咱们的芯片发展史也都会写下浓墨重彩的一笔。

昇腾910-最快的练习芯片

昇腾910搭载的是华为自研的达芬奇架构,达芬奇从IP到指令集都是华为自己的专家发明的,而且支撑全场景人工智能运用。昇腾910的算力是国际顶尖AI芯片的2倍,适当50个当时最新最强的CPU。因此,昇腾910的练习速度比当时最新最强的芯片提升了50%-100%。

昇腾910 AI处理器内置32个达芬奇AI Core,依据7nm增强版EUV工艺。除了依据达芬奇架构的AI核外,昇腾910还集成了多个CPU、DVPP和使命调度器(Task Scheduler),因此具有自我办理才能,可以充分发挥其高算力的优势。在算力方面,昇腾910芯片到达了规划标准(半精度(FP16)256Tera-FLOPS;整数精度(INT8)512Tera-OPS)。此外,昇腾910芯片到达标准算力所需功耗(310W)低于规划值(350W)。

在华为全联接2019大会上,华为发布了全球最快AI练习集群华为Atlas 900。其便是依据数千颗昇腾910 AI处理器互联构成,总算力到达256P~1024P FLOPS @FP16,适当于50万台PC的核算才能。

含光800-最强的推理芯片

含光800是一款云端AI推理芯片,峰值功能为7.8万IPS(每秒能处理7.8万张相片),峰值能效到达500IPS/W。据介绍,1颗含光800的算力适当于10颗GPU,现在依据含光800的AI云服务已在阿里云上线。

含光800不同于依据冯·诺依曼架构的传统通用处理器,而是依据神经网络推理运算特征,规划特定的硬件神经元、高速衔接的存储结构以及专用指令集,对内存和核算单元完结高效安排办理,完结单条指令完结多个操作,进步核算功率和内存拜访功率。

含光800在算法方面也得到了加强。达摩院机器智能试验室曩昔两年构建了完好的算法系统,包括语音智能、言语技能、机器视觉、决议计划智能等方向,而且获得多个国际领先水平的效果。

不管是练习仍是推理都需求强壮的算力支撑,而两块芯片都体现了优异的功能。

经实测,昇腾910 打造的Atlas 900可以在60秒完结依据Resnet-50模型练习,比第2名快15%。这可以让研究人员更快的进行图画、语音的AI模型练习,让人类更高效的探究世界奥妙、猜测气候、勘探石油,加快自动驾驶的商用进程。在一张会聚有20万颗星星的南半球星空图上,天文学家想找出某种特征的星体,需求169天的工作量,Atlas 900只需求10秒。

在城市大脑中实时处理杭州主城区交通视频,需求40颗传统GPU,延时为300ms,运用含光800仅需4颗,延时降至150ms。

昇腾910和含光800有一个共同点,都不独自对外出售。昇腾910经过AI加快模块、AI加快卡、AI服务器等方式对第三方出售;含光800将经过阿里云对外输出AI算力。

昇腾910和含光800可谓是术业有专攻,各自有各自的特色。不管是练习仍是推理,在AI运用落地中都至关重要,两款芯片可以在各自的范畴做到国际第一,足见各自背面团队的真功夫。一起,这些有着中文古典姓名的芯片不断涌现也代表着国产芯的蒸蒸日上。假如有其他的企业可以做到这一点,信任咱们也乐意持续被这样的“文字游戏”所套路。

Posts Tagged with…

Write a Comment

电子邮件地址不会被公开。 必填项已用*标注