乐鱼官方网站

网站首页

产品中心

乐鱼 乐鱼官方 乐鱼官方网站 乐鱼电子官方网站

新闻中心

关于乐鱼官方网站

公司概况 核心优势 核心团队 发展历程

联系乐鱼官方网站

官方微信 官方微博
乐鱼官方网站 > 新闻中心

官宣!一图看懂阿里全球最强AI芯片

发布时间:2024-02-20 04:07浏览次数: 来源于:网络

  今天,阿里云栖大会:平头哥半导体正式发布了阿里巴巴的第一款芯片——含光800。

  据悉,含光800AI芯片是阿里巴巴第一款正式流片的芯片,主要应用于云端视觉处理场景,性能打破了现有AI芯片记录,性能及能效比全球第一。

  阿里巴巴集团CTO、达摩院院长张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。

  性能方面,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍;1颗含光800的算力相当于10颗GPU,目前基于含光800的AI云服务已在阿里云上线,相比传统GPU算力,性价比提升100%。

  据阿里巴巴方面介绍,含光800虽然是阿里巴巴第一款芯片,但却是全球性能最强的AI芯片。作为一款主要用于云端视觉处理场景的芯片,含光800的性能打破了现有AI芯片记录,在性能及能效比方面统领全球第一。

  在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

  目前,含光800已经实现了大规模应用,应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。

  云栖大会现场演示了该芯片在交通状况识别及拍立得商品识别上的两个具体应用。

  以杭州城市大脑实时处理1000路视频为例,过去使用GPU需要40块,延时为300ms,单路视频功耗2.8W;使用含光800仅需4块,延时150ms,单路视频功耗1W;

  上图是杭州交通状况的视频,含光可以在极短时间内对车的路况做出及时准确的识别,只需要用到以前1/10的硬件就可完成通用GPU能够完成的任务!

  拍立淘商品库每天新增10亿商品图片,为了让用户快速从海量图片中精准搜索到商品,需要强大的计算力支撑,使用含光800搜索效率可提升12倍,时间从传统通用GPU的1小时缩减至5分钟。

  在下午的芯片生态分论坛,平头哥的7个客户——清微智能、云天励飞、炬芯、奉加微、联盛德、艾派克、博雅鸿图——接连发布7款内置玄铁处理器的芯片,应用领域涵盖视觉、语音、微控制、无线芯片等。

  玄铁系列处理器和无剑平台已经拥有100多家客户,这次上新的7家公司,既有垂直行业领军者,也有新兴领域后起之秀。

  炬芯是国内最老牌的IC设计企业之一,云天励飞是业界知名的AI独角兽。清微智能、联盛德、博雅鸿图在可重构计算芯片、物联网通信芯片和数字视网膜芯片领域各有专长

  艾派克在中国打印机主控芯片市场占有龙头地位,预计在2019年,搭载平头哥内核的艾派克芯片出货量将达2亿颗。蓝牙芯片新锐企业奉加微今年年初结识平头哥,在获得平头哥玄铁802 MCU、YoC操作系统及CSI外设接口的授权后,用6个月就完成了芯片设计。

  阿里巴巴经济体内部当然也有平头哥的客户,就在今天,天猫精灵与平头哥合作研发的智能语音芯片也正式发布了,天猫精灵马上要推出的音箱将会搭载这款产品。

  这天,平头哥的生态伙伴,包括Foundry厂商、IP供应商、EDA供应商等也都来到了现场。台积电(南京)有限公司总经理罗镇球发表了演讲,铿腾(Cadence)等9家半导体IP供应商加入了平头哥牵头发起的IP平台联盟,新思科技与阿里云、平头哥联合发布《云端设计白皮书》。

  关于含光800以及阿里巴巴的芯片研发计划,解放日报·上观新闻记者整理了相关问题,并得到阿里巴巴的官方答复。

  阿里巴巴是全球最大的人工智能应用者之一,丰富的场景为研发人工智能芯片提供了绝佳平台,这是旗下芯片公司平头哥的天然优势。依托阿里巴巴集团丰富的应用场景,平头哥早期就针对场景做了大量优化,因此实现了含光800在性能上的突破。

  而且,研发含光800不仅是为了满足阿里巴巴集团内部场景的需求,也会通过阿里云对外输出,帮助企业用更低的成本获取高性能算力,加速业务创新。例如,对于受限于算力瓶颈的企业而言,含光800可以更高效地运行更复杂、更先进的。

  A:顾名思义,神经网络处理器(NPU)就是专门处理深度神经网络算法的芯片,深度神经网络就是一种模仿生物神经网络结构特点的计算机算法,最基本的特征就是模仿大脑神经元之间传递模式,并对输入的信息进行快速处理。

  传统通用处理器基于冯诺依曼结构,其存储和运算处理是分离的;如果处理深度神经网络,需要大量读写运行操作,会受到带宽限制,因此效率较低。

  而以含光800为代表的神经网络芯片,根据神经网络推理运算特征,设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

  A:过去一年,平头哥团队在不断探索芯片与场景的融合。阿里巴巴拥有丰富的人工智能应用场景,图像视频分析、搜索、推荐这些业务场景都需要AI专用芯片提供算力,而图像、视频对算力的需求量最大。所以,就有了专注于人工智能视觉的含光800。

  人工智能的应用场景很丰富,所以平头哥也针对场景深度定制了芯片的软硬件,例如自研了架构、软件编译器、框架、工具链等。这为后期开发其他芯片产品打下了基础。

  值得注意的是,平头哥用最短的时间完成了含光800芯片的设计、流片整个过程,7个月完成前端设计,之后仅用3个月就成功流片。这说明平头哥构建的芯片软硬件技术栈发挥了作用。

  未来,平头哥还会推出更多形态的人工智能芯片,在终端、云数据中心都会有更大规模的部署和应用。

  Q:我们注意到,含光800是一款集合算法和芯片架构的产品,可以说创新了算法和芯片架构的协同。平头哥是如何考虑这一设计的?

  A:事实上,平头哥研发芯片并非从零开始,而是基于阿里达摩院的算法以及阿里巴巴集团硬件基础设施多年技术沉淀。

  由于人工智能芯片的差异化设计主要体现在硬件架构和软件算法上,二者需要高度适配才能发挥芯片的最大价值。从目前来看,传统CPU、GPU在深度学习推理任务上并没有完全发挥硬件能力,例如GPU架构主要针对图像处理设计,其硬件结构、软件生态几乎固化,因此对AI任务很难有深度优化。

  含光800性能的突破得益于软硬件的协同创新。芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积、矩阵乘、向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。

  算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果,这些都为平头哥研发芯片提供了帮助。

  协同算法和芯片架构的设计理念效果可以说是立竿见影的。例如,功耗是人工智能芯片行业通病,但平头哥的自研架构可大幅减少对内存的访问,在保证极致性能的情况下,把芯片功耗降到最低水平。

  Q:我们注意到,在含光800的介绍中,提到了“流片”(记者注:指芯片试生产)。芯片流片的难点在哪?

  A:芯片设计是一个复杂的系统工程,单纯完成设计并不意味着就可以流片成功,这是行业的深水区。假如流片失败,意味着硬件设计需要推倒重来,这比软件出BUG问题更加严重。一般芯片公司需要做两次(engineering sample、production sample)或多次才能流片成功。

  流片成功后也不代表就可以直接商用。它还需要经过复杂的测试验证,在各项指标都符合实际场景需求后才到了真正的商用阶段。

  但值得骄傲的是,含光800已经完成了整个流片过程,已应用于阿里巴巴集团内部各大场景。这背后主要得益于阿里软硬件的深厚积累以及丰富的验证场景。

  A:含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务已经正式上线,相比传统GPU算力,性价比提升100%。端云一体芯片是平头哥的主要方向,终端玄铁处理器可以与云端含光800芯片协同。

  平头哥致力于做普惠芯片,无剑SoC平台和玄铁处理器IP来帮助企业降低芯片设计门槛;含光800通过阿里云AI云服务的形式让企业随时随地可以享受高性能计算服务。

  Q:我们注意到,在平头哥之前发布的产品中,还包括SoC芯片平台“无剑”。这不是一颗芯片,而是芯片设计平台。平头哥为何如此设计产品?

  A:平头哥和绝大多数芯片商不同——成立的目的不是卖芯片,而是延续阿里巴巴“让天下没有难做生意”的愿景,希望用全新的商业模式为企业提供普惠算力。所以,目前平头哥已经拥有全栈芯片产品家族,涵盖终端处理器IP“玄铁”、终端芯片设计平台SoC“无剑”、云端AI芯片“含光800”等不同类型的产品。它们互相配合,构建了端云一体的芯片生态,能为企业提供普惠算力。

  AIoT场景需要新的计算架构,需要安全、在线和智能等新的特性,所有芯片面临升级,这必将在芯片行业将引起一波全新技术革命和产业浪潮。但AIoT市场有强应用驱动和场景碎片化等特点,芯片公司按照传统的方式设计芯片很难去适应未来的需求,平头哥希望通过端云一体芯片生态为各行业提供普惠算力。

  A:总体来说,芯片是计算力的核心。计算力是所有互联网应用的基础。研发芯片可以降低阿里巴巴经济体整体计算的成本,还可以以云服务的方式交付,以更高的性能和更低的成本赋能更多的企业。

  阿里巴巴经济体横跨电商、金融、物流、云计算、大数据、全球化等场景,用户规模庞大,拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,需要使用大量芯片。阿里巴巴坚持以技术创造新商业,于2017年成立达摩院,布局颠覆式技术创新研究,在芯片等关键领域做基础性技术的研究投入,能为未来发展提供更多战略可能。

  A:阿里巴巴在芯片上的定位是:端上做芯片基础设施官宣!一图看懂阿里全球最强AI芯片,云端为企业提供普惠算力。例如,处理器是所有高端系统芯片都需要的基础产品,AI芯片是人工智能场景最高效的算力单元,阿里巴巴将投入重金打造好这些技术,同时构建应用生态。

  除此之外,平头哥还将继续开发操作系统,软硬件融合的算法,核心的IP等。把这些共性的技术能够做好做精做出竞争力,并形成生态,然后开放给我们的芯片设计产品,让他们基于高质量的基础设施打造芯片产品,有助于提升整体的产业竞争力。

下一篇:芯片行业再迎好消息!SK海力士Q4意外扭亏为盈 AI芯片需求火爆
上一篇:全球AI芯片公司排行榜-----各家AI公司的分析对照

咨询我们

输入您的疑问及需求发送邮箱给我们