1月5日,国芯科技发布自愿性披露公告,宣布其研发的神经网络处理器DPNPU(Dataflow Parallel NPU)新IP产品顺利通过内部测试,该产品面向端侧与边缘计算场景,将为各类智能设备提供高效灵活的AI算力支持。
据公告披露,国芯科技DPNPU新IP产品是一款高性能AI处理器,针对人工智能应用中复杂多变的计算任务进行多维度优化,核心目标是实现功耗、性能与灵活性的最佳平衡。在核心性能方面,该产品单核支持0.5~4.8TOPS的灵活算力配置,且支持算力线性扩展,可根据不同应用场景提供定制化AI算力解决方案。
架构设计上,DPNPU采用符合RISC-V指令集架构标准的创新开放架构,通过将RISC-V核心与高性能神经网络加速单元进行架构层面深度优化,搭配专用的TDS(Task Distribution & Synchronization)硬件调度引擎,能将网络模型中的算子序列转化为高效节点化任务流,实现任务管理、数据流控制与AI专用计算的统一高效调度。同时,产品采用脉动阵列高效动态融合技术,保障设备长时间运行的稳定性与卓越能效。
功能覆盖方面,DPNPU内置90余种神经网络算子,全面兼容CNN、RNN等主流神经网络架构,并支持LSTM、GRU等RNN变体,通过RISC-V指令和硬件通用性设计可扩展支持更多新型算子,适配未来AI模型发展需求。量化技术上,该产品支持训练后量化(PTQ)的四种主流方式,同时兼容INT8和FP16混合精度量化,在保持模型精度的前提下,大幅降低计算资源与存储空间占用。此外,产品集成自研PCD(Parameter Compression & Decompression)模块,通过参数压缩与硬件自动解压缩技术,有效缓解数据吞吐瓶颈,提升系统整体性能。
为降低AI应用开发门槛,国芯科技围绕DPNPU构建了完整的软件生态——C*Core NPU Studio,涵盖工具套件、驱动和运行时软件三大核心组成。其中,工具套件提供模型转换、预处理、量化、编译、仿真等端到端模型部署能力;运行时软件包含推理框架软件和扩展软算子库;驱动则适配RISC-V等主流CPU平台,支持Linux/RTOS/Bare-metal等多种应用环境,可显著缩短AI应用从开发到部署的周期,提升落地效率。
公告指出,当前人工智能技术正加速渗透至工业控制、智能家电、汽车电子、医疗健康等关键领域,端侧与边缘侧AI因具备实时响应、数据隐私保护、低网络依赖等优势,对芯片能效比和算力密度提出了更高要求。此次DPNPU新IP产品的架构可行性、能效表现及软件栈均已完成验证,为公司NPU技术持续研发及端侧、边缘侧AI芯片的发展与应用奠定了坚实基础。
国芯科技表示,公司对DPNPU新IP产品拥有完整知识产权,该产品研发成功是公司在人工智能领域坚持创新驱动的重要成果,预计将对公司未来市场拓展和业绩成长性产生积极影响。
