• 3500/15 106M1079-01 支持先进和复杂的人工智能计算


    3500/15 106M1079-01 支持先进和复杂的人工智能计算

    耐能NPU IP系列允许ResNet、YOLO和其他深度学习网络在离线环境下的边缘设备上运行。耐能NPU IP为edge AI提供完整的硬件解决方案,包括硬件IP、编译器、模型压缩。它支持各种类型的卷积神经网络(CNN)模型,如Resnet-18、Resnet-34、Vgg16、GoogleNet和leNet,以及主流的深度学习框架,包括Caffe、Keras和TensorFlow。

    耐能NPU IP系列功耗在0.5W以下,KDP 300版本功耗不到5mW。整个产品线的能效高于1.5 TOPS/W(注2)。通过采用滤波分解技术,可以将一个大规模的卷积计算块分割成若干个较小的卷积计算块进行并行计算。与可重构卷积加速技术一起,来自小块的计算结果将被整合,以实现更好的整体计算性能。通过耐能的模型压缩技术,未优化模型的尺寸可以缩小几十倍。

    此外,耐能NPU可以与耐能的视觉识别软件相结合,为实时识别分析和响应提供解决方案。

    KDP 300通过3D结构光和双镜头相机的图像分析支持3D实时面部识别。KDP 300也适用于要求超低功耗的边缘设备。包括计算和SRAM(静态随机存取存储器)在内的功率小于5mW。

    KDP 500可以对海量人脸、手和身体姿势进行实时识别、分析和深度学习,非常适合智能家居和智能监控领域的应用。它的计算能力高达152 GOPS (500MHz)(每秒十亿次运算),同时保持100mW的功耗。

    KDP 700支持更先进和复杂的人工智能计算,以及高端智能手机、机器人、无人机和智能监控设备的深度学习推理。它目前正处于开发阶段,预计将提供卓越的计算能力,峰值吞吐量可达4.4 TOPS(1GHz)(每秒万亿次运算),同时功耗保持在300~500mW。

    注1:测量条件:CNN切片尺寸150x150,CNN帧率5fps,主频20Mhz。注2:能效因半导体工艺而异。在40 nm工艺下,耐能NPU的能效可以达到1.5TOPS/W以上  

    51308351-175
    51101318-900
    TC-FXX101
    51107404-100
    PFS-778-D-5/1
    10001/1/1
    620-2030
    FTA-T-08
    SDS-C2-D2CM-1
    620-2033
    620-0090
    51309150-225
    620-0038C
    51304516-250
    51201557-100
    51400159-HDW
    621-1100RC
    10205/1/1
    10213/2/3
    621-0010-AR
    621-3580RC
    51304441-200
    10212/1/1
    10201/1/1
    10101/2/3
    51199932-200
    FC-TPSU-2430
    51304446-150
    TC-IOLI01

  • 相关阅读:
    CSRF 跨站请求伪造
    计算机毕业设计Java校园兼职网站(源码+系统+mysql数据库+Lw文档)
    使用 Docker 自建一款怀旧游戏之 - 超级马里奥
    远程访问及控制
    基础会计学试卷
    机械臂速成小指南(八):运动学建模(标准DH法)
    SpringCloud之Hystrix
    Go错误处理方式真的不好吗?
    【日常训练】871. 最低加油次数
    JavaSE学习之--抽象类和接口
  • 原文地址:https://blog.csdn.net/zhang13365909307/article/details/133860404