EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
人工智能与IoT相遇之后,诞生了AIoT,再遇上了5G之后,一个全新的AIoT时代正在被开启。因为拥有广泛链接和超低延迟等优势,5G驱动下的AIoT被产业界誉为继智能手机之后的一个“救星”。按照很多专家的观点,它将给人类生活带来前所未有的新体验,同时也会催生一个万亿市场。为了给消费者带来一个接近完美的AIoT体验,很多技术是必须升级的。尤其是作为设备与人交互重要入口的语音识别技术,更是产业界关注的重中之重。
# f" F# K' u. w* ]: M ' M8 D3 C& E7 m. Q
过去几年,随着苹果siri的流行,加上智能音箱的突然爆发,让大部分人都领会到了“与机器说话”的乐趣。但坦白讲,这些相对智障的交互,也让开发者和消费者都有了迫切升级的冀望。这症是成立至今12年的思必驰一直在致力于解决的问题。 3 b! e9 ~! ~2 W( R
& c! O. R1 a: }8 {$ g8 t智能语音交互技术在AIoT时代面临的挑战
5 H4 k, b1 v9 Z' J1 @4 M$ v: X' ]* a
1 y2 M, }' P7 f5 S+ [, T t8 @5 J, q, T4 h# X) a; M
在日前由雷锋网举办的2019 第四届全球人工智能与机器人峰会上,思必驰CTO周伟达先生告诉记者,物联网的智能语音交互面临以下几点挑战: 1 v1 p+ s0 c4 Y! ?- z" d
思必驰CTO周伟达先生 * h# Q$ `+ i+ W5 R
9 v# `0 w+ z' L- _第一就是低功耗挑战;
! u% ?6 {* e6 ~2 o/ m; m6 ?# V
; v( [- Y9 \* ~% u) x我们知道,很多联网设备都是电池供电的,如果我们的智能语音交互模块再想智能音箱音箱上的产品一样,功耗做到百毫瓦级,那是绝对不允许的。以智能耳机为例,他们的电池仅仅为70到80毫瓦,那就意味着我们在耳机设备上要做语音交互时,功耗要做到1毫瓦。这个1毫瓦是什么概念呢?考虑到普通模拟麦克风的工作电流是70微安,再加上ADC、模拟功放,这样做下来的通用麦克风就达到1毫瓦级别了。
% `) ^! \1 |' x/ ?再看被广泛普及和应用的数字麦克风。数字麦克风的功耗是900微瓦,那就意着留给我们语音的采集、唤醒、声纹、本地识别的空间非常之少。这个过程带来的挑战可想而知。
6 k& G2 W/ Q' n1 R& O4 p& i3 t, e
5 i% N7 l" E% r2 S3 W% a! E( L第二是远场和高噪声的挑战;
. v; Y% z2 n7 h" t
$ Q. T9 W- F4 P9 J4 ^" y
7 q! _& j3 o$ u( M8 h我们现在很多时候使用麦克风的方式是近场的麦克风语音采集,但这在智能家居IoT行不通,因为我们不能总是拿着麦克风,这有违我们平时的使用习惯。为此我们希望能针对智能电视和各种智能家电以及在户外的各种场景,引入能脱离手持麦克风而跟设备进行自然的、智能的语音交互。 + E! ]& o# I" ^3 m: |$ ]
但在这些远场的语音交互中,因为说话者离麦克风距离很远,这面临的第一个问题就是低的信噪比。如果本机播放音乐和合成音跟你交互,本机的混响回到本机设备,就又面临低的回声比,干扰很大。 3 P+ W1 ?) `! ] z/ Q' T- C( R' \
|