端侧方案为何成语音芯片“必杀技”?

来源:爱集微 #探境科技#
2.5w

未来物联网勾勒的美好画卷正徐徐展开,而成为主驱动力的智能家居正躬逢其盛。而在所有打开智能家居大门的“钥匙”之中,语音俨然成为最大热门。据ReportLinker预计,到2024年,全球智能语音市场规模将达到215亿美元。

然而,如果将语音等同于智能音箱,那当是谬以千里。智能音箱作为中控设备只是语音的一个入口。从客厅到厨电、卫浴等应用场景的任意家电产品,语音其实可以脱离音箱实现“单机智能”,而语音芯片,正是其赋能者。

打破固有思维 语音≠云

尽管一提到语音方案,业界的惯性思维大都集中在联网上云的层面,但其实上,应用只有深入到细分市场需求层面,才会激发新的洞察。

探境科技CEO鲁勇,曾深入剖析语音在智能家居产品的需求。以大家常见的互联网电视为例,技术路径一拆为二,一个是语音识别环节,获取用户的指令,另一个是内容获取环节,执行指令获取云侧的影音。

再深一步剖析我们会发现,其实从智慧客厅到智慧厨房、智慧卫浴等细分场景的各类家电中,需要获取影音内容的仅有电视和音箱等极少数家电产品。像灯具、开关、空调等绝大多数的产品,或许会在某些高端产品线上附加此类功能,但并非刚需。

可见,智能家居的语音需求可分为两类,一类是通过语音获取内容,一类是通过语音控制家电。需要获取内容的家电品类并不多,其内容获取环节也与语音技术无关,影音内容的好坏取决于云平台上片源的质量。

而控制电器的技术路径,又可分为“远程控制”及“语音控制”两种。其中远程控制通过Wi-Fi或蓝牙等无线技术实现app联网,并进一步控制电器,其技术的关键节点在于云端联网,远程控制实际上就是控制功能通过联网来延伸。

可见,在智能家居领域,智能交互的最终目的就是为了控制家电设备,与其强相关的只有“语音控制”这一方向。

“语音控制”本身则可细分成“指令型”与“自然型”(即NLP自然语言处理)两种。“指令型”可通过离线来实现,也可通过在线来实现。而NLP目前主要是通过云侧实现。

“就像大家把云和语音强关联一样,其实很多人又把‘云’和‘NLP’两个问题混到了一块,认为自然语言识别就得上云。”鲁勇认为,未来随着算法模型越来越小、而芯片功能越来越强大,NLP实现离线识别将指日可待。

可见,语音识别并不等于云。语音识别和云计算是两个层面的事情,一个是具体的技术,一个是基础计算设施。语音识别技术的实施途径分为离线和在线两种,两者的区别是将计算放在端侧还是云端进行。

事实上,智能家居领域,离线语音方案有其特定的优势。

离线语音的普世之路

在不远的未来,万物互联将催生上亿台设备,如果所有计算都放在云端的话,不仅成本昂贵,而且效率难以保证。尤其是智能家居这一特殊场景,对实时性、稳定性及隐私性都有极高的要求。出于对云端数据处理能力、网络延迟及数据安全性的考虑,把算力“下放”到靠近终端的边缘计算将得到快速的发展。

如果说这是产品设计的考量,那么从生态链角度出发,对于广大的家电厂商而言,上云意味着或将流量入口或大数据开放给第三方的生态链公司,或自建私有云入口,既要考虑生态的兼容性,又存在一定的研发门槛,而端侧方案则不必考虑诸多顾虑,更可放手一博。

对于C端用户而言,离线语音带来的好处也是显而易见。用户无需购置和使用智能音箱等这类集中式控制硬件,也无需考虑不同品牌与云平台的兼容,亦无需要考虑私隐安全的问题。更重要的是,离线方案无需依赖网络、没有延迟、识别精准,从而降低了用户的使用门槛。

鲁勇认为,智能家居发展方向应当是“先实现智能,再考虑生态”,本该保证产品易用性的生态,不该成为制约用户使用的障碍。

离线语音使智能家电产品变得像USB一样,实现即插即用,没有任何使用门槛,这将从根本上提升最终的用户体验,大大打消终端消费者的使用顾虑。此外,离线语音可面向几乎所有的家电品类,让每一台家电都成为真正的智能化设备,让智能家居从小众产品变为普世产品。

正是凭借自身深厚技术底蕴与敏锐市场判断力,探境科技离线语音识别芯片——音旋风VOI611迅速打开了市场的大门。音旋风VOI611在市场上的竞争优势极为明显:支持200条命令词,拥有高达99%唤醒率与97%识别率,误唤醒率少于1次/24小时,响应时间小于0.2s,可做到10米远场识别距离,具有精准的识别效果。

此外,探境科技的语音芯片价格几乎与普通MCU持平,且没有任何研发门槛,这无疑将大大加快家电企业智能化的速度。

目前探境科技已覆盖的智能家居产品包括:智能灯具、智能开关、空调伴侣、语音风扇、空气净化器、晾衣架等多个品类,合作厂商包括美的、海尔、新颐、艾美特等知名企业。

同时鲁勇强调,端侧和云端,并不是非此即彼的单选题,在已有端侧语音方案实现单机智能的前提下,是否要联合Wi-Fi模组,或是增加云端识别,对于厂商而言不过是一道可以自由组合的多选题。

目前业界已意识到在线方案的诸多弊端,“离线+app”、“离线+云识别+app”这样的离在线方案已见苗头,鲁勇认为随着语音方案的算法模型越来越小,以及芯片性能逐步提升,端侧NLP的技术壁垒已可攻破。未来离线NLP技术成熟之后,更智能、可定制的离线NLP语音方案将是家电厂商的不二之选。

未来“芯”中有数

看准离线语音芯片的锚点,探境已然长线布局,取得初步研发成果。

2020年第四季度,探境科技内部代号为音旋风二代的芯片产品已流片成功。音旋风二代与一代相比,算力更强,可以运行更大的神经网络模型,同时功耗更低,价格也更低。此外,探境的端侧NLP产品也已现雏形。

凭借“存储优先架构”(SFA架构)解决存储墙这一独一无二的硬件架构,辅以打通语音识别全链路的算法精进,探境的语音芯片具有体验好、功耗低、性价比高、实用性等优势。

鲁勇提到,探境不仅可为客户提供芯片、算法、Turn-Key等多种语音方案,还支持客户进行二次开发,支持算法移植。在系统软件层面,对于不同的客户提供不同层次,包括指令集、SDK开发环境或应用层语音/图像算法,并可为客户个性化部署流程。

在鲁勇看来,无论任何产品都要尊重人性,人需要陪伴,需要情感交流,这也是探境的终极发展方向,而语音和视觉正是自然界中人类最便捷最符合人性的交互方式,探境科技不会单纯的追求某个AI技术指标,而是要做有温度的芯片方案,以AI技术推动生活。

“下雨时每一滴水会如何进入到山谷,这个路线是肯定无从了解的。但是你一定知道方向——因为有重力,所以必然向下。而类似于必然发生的「重力」,商业趋势也是必然的,总体趋势一定能够预知。”物联网之父凯文•凯利曾如此总结趋势的重要性。

在经过市场的锤炼之后,探境未来也将更加“芯”中有数。未来,探境秉持对市场的潜心洞察与剖析,加以硬件、算法的持续创新,也将迎来新的高光时刻。

(校对/范蓉)

责编:
来源:爱集微 #探境科技#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...