找回密码
 注册
关于网站域名变更的通知
查看: 251|回复: 0
打印 上一主题 下一主题

基于九齐单片机的智能音箱解决方案

[复制链接]
  • TA的每日心情
    慵懒
    2023-6-20 15:59
  • 签到天数: 2 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
    发表于 2022-4-16 17:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    本帖最后由 xinlinggo 于 2022-4-16 17:44 编辑 # H  y# `6 j0 a

    ) w5 Z5 c# r  j! {& Q/ K- u
    目前的家庭智能音箱可以实现语音定闹钟、人工语音互动、语音播放音乐、查天气、查百科、查路况等功能,链接网络后可实现了解未来天气、上网购物、打电话等更多功能,另外还可以连接第三方软件,也可实现对家用智能电器的控制,可以说功能十分的强大。
    2 {0 e" n; \. \% g智能音箱相比于传统音箱的优势在于其能够通过语音实现“隔空操作”。智能音箱的基本原理是用户使用自然语言与音箱交流,音箱通过识别用户的语音指令完成相应任务,在人们不方便使用手机或其他电子设备时提供帮助。用户更多的是通过声音与其进行交互,从而解放了双眼和手指。
    6 v  y; B' i: O" D3 ~9 o芯岭技术为企业提供了一种基于九齐单片机智能音箱解决方案,下文是方案的一些相关介绍。

    ! E0 ^) h+ X- ~% n- V
    . q  l% J4 D( X+ T7 v一、智能音箱解决方案的主要技术:
    7 S1 W* ^0 C) {) K2 s
    智能音箱的工作流程为语音唤醒,之后内部处理,最后找到对应内容输出,其中主要包括前端信号处理、语音唤醒、语音交互等技术。
    1、前端信号处理
    前端信号处理是在唤醒前进行准备工作,音箱工作时,麦列处于拾音状态,当接收到声音时,对声音进行处理,包括语音检测、降噪、声源定位和波束形成四个方面。
    语音检测用来检测出音频信号语音段的起始位置,并过滤不相干的非语音信号,达到分离语音段和非语音段信号的目的。降噪即减少噪音对智能音箱识别的影响,包含声学回声消除和去混响。实际环境中存在各种各样的噪声,采取降噪来降低噪声干扰,提高信噪比。由于室内语音会被墙壁等多次反射,采集到的声音较混杂,采用去混响来处理。声源定位是根据麦列,确定使用者的位置。可以用来展示方位灯,增强交互效果,也可作为波束形成的前导任务,确定空间滤波参数。波束形成通过利用空间滤波,将多路信号整合为一路,达到增强原始语音信号和抑制旁路信号的目的。
    2、语音唤醒
    语音唤醒又称关键词检测,即在连续不断的语音中将目标关键词检测出来,一般目标关键词的个数较少。语音唤醒性能取决于唤醒率和误唤醒率。唤醒率指将连续语流中存在的唤醒词检测出来的概率。语音唤醒常用的实现方式是dnn+hmm(深度神经网络+隐马尔科夫模型)和lstm+ctc(长短时记忆网络+全连接时序分类模型)。目前开源的唤醒方案可提供SDK,实现唤醒功能一般分为在线和离线版本。国内主要以科大讯飞为代表。网上也有多种开源的小型语音识别引擎,可实现单独的语音唤醒功能,性能参差不齐。
    3、语音交互
    语音交互包括语音识别、自然语言理解、对话管理、自然语言生成和语音合成。
    语音识别技术也称为自动语音识别,可将语音信息转为文字信息。用户发出的指令为语音,然而语音并不能直接拿来分析,需要转化为文字。随着深度神经网络的应用、大数据的使用和云计算的普及,语音技术已经进入人们的日常生活,如科大讯飞、阿里巴巴的AliGenie、喜马拉雅的小雅等。
    自然语言理解的目的是将自然语言转化为计算机易处理的形式,即接收到指令后,识别出用户命令的所属领域,之后再相应领域识别用户的意图,最后进行实体抽取,确定意图的参数。目前,自然语言处理使用的NPL算法是基于机器学习的,拥有各类语言处理的数据集,其中包括中文分词、词性标注、实体识别、句法分析以及自动文本分类等功能。
    对话管理对连续对话的交互极为重要,一般的解决办法是将上轮对话解析的参数作为全局变量,带入到下一轮对话,根据当轮对话和一定条件来判断是否保持在上一轮的领域,或是清空上下文。
    自然语言生成是使计算机具有人一样的表达和写作的功能,即能根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,自动生成一段高质量的自然语言文本。语音合成又叫文语转换,能使智能音箱像人一样朗读任意给定的文本。主要合成方法有参数合成和拼接合成,其中参数合成计算量小,部署灵活,但自然度较差。拼接合成接近真人发音,存储和计算资源高,一般只能在线合成。

    / R1 c  N1 H. c8 l7 n$ t. e

    % g. Q) g$ z1 v: o二、智能音箱解决方案可实现功能:3 t0 l7 ^$ U" V% {1 j4 e2 i+ W
    芯岭技术的智能音箱方案的主控芯片采用了台湾九齐NY8A051F这款单片机,封装型号为8引脚sop,该方案通过程序编写,烧录,电路设计完成功能模块的搭建,产品设计完成之后,最终能够实现如下多种功能:
    5 w7 k8 I( O0 e6 T& Z1、夜灯功能:七彩闪烁小夜灯,跟随音乐的节奏闪烁;
    2、LED显示:外置显示屏,电量显示,音乐显示;
    3、时钟显示:自动适配时区,24小时时钟显示;
    4、语音交互用语音替代了之前的触摸按钮等交互功能,方便您的生活。
    ; {+ z9 N0 Q% v! W( p' c
    8 K* }% t- \+ q9 c+ ?$ n" v5 Q% A9 j; J( k) d/ q; N% K7 l
    深圳市芯岭技术有限公司是一家创新的物联网整体应用解决方案商,从事芯片代理、方案开发、物联网产品研发、生产、销售,同时为众多企业提供物联网应用解决方案服务。公司具备智能家电、智能家居、智能硬件、智能门店、智慧农业等物联网解决方案,公司一直致力于物联网技术及市场推进。

    # ]0 z/ Y, H5 }1 A* N
    3 f! ^) W7 I9 j# M" w0 A: ~# x7 T
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-7-5 07:44 , Processed in 0.109375 second(s), 25 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表