集微公开课第十五期笔记:智能语音赛道如何跑赢?启英泰伦从“芯”出发

来源:爱集微 #集微公开课# #启英泰伦# #AI#
1.8w

集微直播间自开播以来获得了大量来自行业的关注与好评。其中“集微公开课”栏目联合行业头部企业,通过线上直播的方式分享精彩主题内容,同时设立直播间文字提问互动环节。集微网希望将“集微公开课”栏目打造成中国ICT产业最专业、优质的线上培训课程,深化产教融合,助力中国ICT产业发展。

5月22日(本周五)上午10点,第十五期“集微公开课”邀请到成都启英泰伦科技有限公司技术支持总监孙振奎,带来以《生态赋能,语音引领美好“芯”生活》为主题的精彩演讲。

点这里观看回放

启英泰伦是一家专注于人工智能语音芯片及提供配套应用解决方案的企业,致力于为用户提供最自然、最简单、最智能的人机交互体验,让“人工智能+”产品无处不在。

作为人工智能语音芯片领域的领导者,启英泰伦是行业首家同时掌握人工智能语音算法、芯片设计、语音数据处理及训练引擎、软硬件产品应用方案开发全技术链企业,可为用户提供一站式Turnkey服务,目前已申请了100多篇相关知识产权,在集成电路设计技术、本地语音识别技术、语音降噪处理技术等领域均属国内领先水平。

根据九鼎投资整理的资料,启英泰伦是西南地区唯一一家语音AI芯片企业。根据腾讯发布的《中美两国人工智能产业发展全面解读》中,启英泰伦作为一家端侧企业上榜。

语音行业趋势与落地条件

语音交互是AI智能的一个重要方向,也是最直接、最便捷的交互方式之一。语音AI凭借高效率、自然交互、功能赋能,推动传统电子产业智能化改造,形成爆发态势。

孙振奎表示,中国智能语音产业从2018年到2020年,规模由100多亿元迅速发展到200多亿元。根据预测,2022年市场规模有望达502亿元。同时,语音芯片需求量也在逐年增加,语音AI芯片需求每年会超过数亿颗

然而,语音产品落地也存在一些痛点。

孙振奎表示,能效标准严格方面,由于部分语音产品无法达到这样的低功耗,成为此前落地慢的原因之一;用户环境私密方面,应用、隐私需兼顾;设备普及化方面,好产品要在市面上普及,低成本也是关键之一;用户体验方面,需要做到识别率高、响应快;功能设备方面需要做到稳定可靠。而启英泰伦的芯片解决了诸多问题,目前语音产品落地效率也在急速增长中。

孙振奎强调,专用语音AI芯片是语音场景化落地的关键。他指出,语音方案目前有两种形态,一种是功能控制型设备,例如空调可以借助语音离线控制,我们建议使用专用语音AI芯片;另一种是多媒体设备,例如智能音箱,可以借助离线AI与在线AI实现本地和云端的控制等。

启英泰伦“芯”实力

孙振奎表示,启英泰伦是行业首家具备AI语音全栈式技术Turnkey服务提供商,依托AI芯片基础、语音算法软件等,为客户提供整套应用解决方案,覆盖智能家居、智能家电、智能照明、智能音箱等多个领域。

据介绍,启英泰伦目前可提供的方案包括单MIC、双MIC、本地、本地+云端,并支持中文、英文和日文。

目前启英泰伦芯片包括CI1006、CI1002与CI110X。

其中,CI1006是2016年全球首发基于BNPU的语音识别芯片,支持离线DNN运算;CI1002是启英泰伦1.5代芯片;CI110X是目前主推系列,包含CI1002和CI1103两个芯片。

CI110X芯片具备强算力、低功耗、高集成、体验佳、低成本等特点。算力方面,采用启英泰伦自主专利技术2代BNPU进行高性能神经网络并行计算;功耗方面,基于VAD的低功耗芯片架构和特色低功耗设计;集成度方面,高度集成,codec拾音、麦阵处理、ASR、控制等于一体;体验方面,支持本地大词汇量,和本地+云端语音识别方案;成本方面,采用NPU架构,性能高而价格和DSP、MCU方案同量级。

据悉,CI110X语音识别率可以达到97%,可做到本地离线识别,响应时间最短仅为0.2秒,远距识别可达10米等。

孙振奎表示,CI110X完全可以当作传统MCU来使用,同时集成具备语音识别功能的BNPU,因此可以作为主控使用。

启英泰伦语音方案

方案一:

CI1103通过串口与WIFI模块连接;CI1103做音频前端处理和本地识别,多媒体播放,在WIFI模块上跑对接语音云服务的协议栈;CI1103通过UART向WIFI模块传输语音数据、发送控制指令、接收控制和同步信息,WIFI模块通过UART向CI1103传输播放音频,发送控制指令、接收控制和同步信息。

方案二:

CI1103通过IIS向BK7251发送音频数据。CI1103通过UART向BK7251发送同步信息和控制指令,通过IO口向BK7251发送音频起始和音频结束标记。BK7251运行对接云的协议栈,并且进行多媒体播放,BK7251通过UART向CI1103发送同步信息和控制指令。

CI1103通过串口与WIFI模块连接;CI1103做音频前端处理和本地识别,多媒体播放,在WIFI模块上跑对接语音云服务的协议栈;CI1103通过UART向WIFI模块传输语音数据、发送控制指令、接收控制和同步信息;WIFI模块通过UART向CI1103传输播放音频、发送控制指令、接收控制和同步信息。

方案三:

使用SDIO接口接射频类WIFI模块,wifi仅做数据透传;CI1103上运行协议栈、LWIP、AEC、流媒体播放、本地唤醒及识别;本地命令词支持10条以内。如果不做在线内容识别,只做IoT控制,则CI1103上可以支持100词条左右。

方案四:

CI1103上运行本地识别,并将识别结果的控制同步给IoT云;手机app控制信息通过庆科云将数据传给庆科3076,再下发至CI1103进行本地控制;本地支持词条300+左右。

降噪、AEC、DOA及语音增强方案

据介绍,目前CI110X芯片广泛运用在各类产品里,例如,智能卧室、智能客厅、智能厨房、智能卫浴、智能阳台、智能健康电器。换而言之,全屋凡是带电的设备都可以通过加上语音模块等来实现语音控制。

启英泰伦AI平台

为了方便方案商进行方案开发,启英泰伦开发了语音AI平台,通过该平台,方案商可以自主定制命令词,以便对不同领域不同客户进行方案开发,直至量产。同时,通过该平台,方案商可以获取到最新的技术资料。

对于注册账号、方案商账号、Demo账号可享受不同的权利。

下周公开课、开讲活动预告:

集微直播间自开创以来获得了大量来自行业的关注与好评。下周,集微网将继续为大家带来精彩不断的直播。526-30日(周二-周六),集微开讲、集微公开课轮番上阵,让你过足瘾!

如果想与爱集微平台合作,或是了解相关活动问题,皆可与集微网徐伦联系(微信/电话同15021761190)。

(校对/图图)

责编: 慕容素娟
来源:爱集微 #集微公开课# #启英泰伦# #AI#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...