物联网操作系统AliOS Things 3.3
audio_demo

1、方案介绍

本文主要介绍如何基于HaaS100硬件平台搭建“云端钉一体”(阿里云IoT平台 + HaaS100 + 钉钉小程序)的智能语音播放器(以下简称智能语音播放器)。该智能语音播放器包含如下功能:

* 小程序:加载/卸载HaaS100上的声卡模块。

  • 小程序:TTS (Text to Speech),智能语音合成功能。
  • 小程序:开始/停止录音,录音文件路径/data/rec.pcm
  • 小程序:音乐播放功能,例如音量调节/播放/暂停/上一首/下一首/播放列表等。
  • 本地Shell: 音量调节,本地音乐/ 网络音乐播放(.mp3, .m4a等格式)等。
  • 本地Shell: TTS (Text to Speech),智能语音合成功能。

2、硬件平台搭建

智能语音播放器整体框架图

智能语音播放器需要的硬件模块包括: 硬件列表 购买链接仅供参考!!我们不负责商家发货的品质保障等问题!!

名称数量参考链接
HaaS100开发版1HaaS100购买链接
microUSB数据线1普通microusb线即可
模拟MIC1模拟MIC参考链接
喇叭1喇叭参考链接

3、HaaS100端测软件开发

**智能语音播放器的软件框架图**,

如上图所示智能语音播放器软件模块包括:

* audio_demo: 主要打通HaaS100和阿里云物联网平台连接、通信,物模型解析,播放器功能逻辑的实现。

  • uVoice组件:是AliOS Things上智能语音解决方案的核心组件,提供了本地音频,URL音频,TTS合成等基础功能,音频格式支持mp3, m4a, wav, opus等主流格式。
  • A2SA组件:是AliOS Things上音频服务框架,兼容ALSA应用接口访问,支持音频硬件驱动抽象,多音频驱动加载/卸载,VFS接口支持等功能。多播放焦点管理,混音,softvol,重采样等功能设计中。
  • 麦克风/喇叭驱动:HaaS100上已经集成了模拟麦和Speaker的硬件驱动。

HaaS100端测软件开发包含以下3个步骤:

* AliOS Things开发环境搭建

  • HaaS100智能语音播放器代码下载
  • 代码编译、烧录

3.1、AliOS Things开发环境搭建

开发环境的搭建请参考 HaaS100快速开始 (搭建开发环境章节),其中详细的介绍了AliOS Things 3.3的IDE集成开发环境的搭建流程。

3.2、智能语音播放器代码下载

智能语音播放器的代码下载请参考 HaaS100快速开始 (创建工程章节),其中,

选择解决方案: “HaaS云端钉智能语音播放器”或者“audio_demo” 选择开发板: HaaS100

3.3、代码编译、烧录

编译audio_demo的过程如下: – 首先下载uVoice组件依赖的codec源码

// 在AliOS Things 3.3的工程根目录下执行Shell命令
cd components/uvoice/codec/opensource/pvaac
python get_pv_aac.py
cd ../pvmp3
python get_pvmp3.py

– 参考 HaaS100快速开始 (3.1 编译工程章节),点击 ✅ 即可完成编译固件。

– 参考 HaaS100快速开始 (3.2 烧录镜像章节),点击 "⚡️" 即可完成烧录固件。

4、功能调试

智能语音播放器支持,

* 本地Shell命令行调试模式:又分为离线模式和在线模式

  • 云端钉一体调试模式

其中离线调试模式支持从本地文件系统中播放音频,无需给HaaS100配网,可用于快速验证HaaS100的录音、播放的基本功能是否正常。在线调试模式要求HaaS100网络在线,支持网络音频的播放以及阿里巴巴达摩院TTS语音合成功能。

4.1、播放器离线调试

因为离线音频播放调试需要先在本地文件系统的/data分区中打包音频文件,目前支持.wav和.mp3等常见的音频格式。打包音频文件到/data分区方法如下,

// 拷贝音频文件到hardware/chip/haas1000/prebuild/data
cp ./test.mp3 hardware/chip/haas1000/prebuild/data

然后参考“编译、烧录”章节重新编译和烧录audio_demo固件。 HaaS100固件烧录成功之后可以在串口中敲入“help”命令查看所有支持的CLI调试命令,其中和智能语音播放器相关的常用命令和使用方法如下,

# 查看当前固件支持的所有Shell命令
help
# 加载HaaS100声卡驱动
sound_install_driver
# 循环播放.wav音频10次
sound_wav /data/7.wav 10
# 播放.mp3(只支持1次)
play fs:/data/6.mp3
# 开始录音、播放循环测试
sound_loopback start
# 结束录音、播放循环测试
sound_loopback stop
# 读取当前播放音量(0~100)
sound_getvol
# 设置当前播放音量为90 (0~100)
sound_setvol 90

4.2、播放器在线调试

当上述离线音频播放测试通过之后,证明HaaS100的录音、播放器的硬件和软件环境都是OK的了,接下来就可以尝试连接阿里云IoT平台进行在线音频播放器调试。请按下述步骤操作,

4.2.1 WI-FI 配网

HaaS100支持Shell命令行给WIFI配网,方法如下,

# 串口输入配网命令
netmgr -t wifi -c {ssid} {password}

如果配网信息和四元组信息都正确的情况下,HaaS100和阿里云IoT平台连接成功后有如下HardwareError ping-pong日志打印。

如果,有些开发者发现自己的HaaS100板子WIFI连接路由器困难,那么可以尝试以下方法排查。

* 首先更新github上的最新固件

  • 然后通过Shell命令获取WIFI MAC地址,方法如下
  • aos_mac WIFI
  • 如果WIFI MAC是全0,那么需要更新MAC地址。HaaS VIP钉群中咨询@谷饮,获取唯一的WIFI MAC地址。
  • 最后更新获取到的WIFI MAC,方法如下
  • aos_mac WIFI XX:XX:XX:XX:XX:XX

4.2.2 播放在线音乐

当HaaS100配网成功且可以访问外网之后,可以尝试在串口Shell中使用“play”命令播放在线音乐了,

# 播放在线音乐url, 例如
play https://test-music-url.com
# 其中上面的测试音频url是无效的,因为涉及到潜在的音乐版权问题,需要开发者自己提供可以播放的音乐url。

4.2.3 TTS语音合成

在我们的uvoice组件中集成了阿里巴巴的“智能语音交互”的部分功能,您可以尝试免费试用版的“语音合成”功能,需要商用的用户也可以选择付费开通商用版。阿里云智能语音合成功能提供了Java/ C++/ Restful等多种SDK,开发者也可以自己下载SDK适配。

用户首先登陆“智能语音交互”主页,并根据引导创建一个包含“语音合成”功能的项目。项目创建完成后,项目主页中会生成该项目的“Appkey”和“AccessToken”两个重要信息。

创建智能语音交互项目和获取AppKey

获取智能语音交互AccessToken

在HaaS100 SDK的components/service/uvoice/test/test_tts.c中,我们需要填写正确的AppKey和AccessToken信息才可以使用阿里巴巴“智能语音交互 - 语音合成”功能。值得注意的是,AccessToken是动态刷新的,周期是每个用户账户可配置的,默认是2天变化一次。因此在功能开发阶段,需要周期性的更新固件中的AccessToken,否则可能出现语音合成功能访问失败的问题。如果是产品量产阶段,可以基于阿里云端一体的安全通道周期更新设备端AccessToken。

uvoice组件中修改AppKey和AccessToken代码位置

配置好AppKey和AccessToken之后,参考上述编译和烧录,按以下步骤可以本地测试TTS语音合成功能。

# TTS合成,生成的语音保存在/data/tts.mp3文件中
tts "今天上海天气晴转多云、气温26摄氏度" /data/tts.mp3

4.3 云端钉一体调试

智能语音播放器的云端钉一体调试模式包含:阿里云IoT平台配置,以及钉钉小程序开发两大部分。

4.3.1 阿里云IoT平台配置

阿里云物联网平台创建产品、设备的详细过程可以参考文章《阿里云物联网平台快速入门实践

4.3.1.1 创建智能语音播放器产品

“云端钉一体的智能语音播放器”物模型设计可以参考:“智能语音播放器物模型”(待发布)。在开发者创建自己产品时,可以选择导入我们提供的“智能语音播放器物模型”来生成一个临时产品,从而快速的验证云端钉一体的智能语音播放器方案,请参考下图步骤。

4.3.1.2 修改HaaS100四元组信息

在文件application/example/audio_demo/linkkit_example_solo.c中包含了HaaS100设备和阿里云物联网平台链接的关键密钥信息(四元组)。HaaS100开源SDK中修改audio_demo四元组信息如下所示,

每位用户应该根据自己在"[阿里云物联网平台](https://iot.console.aliyun.com/product)"中创建的产品信息中可以获取到一下四元组信息。只有在audio_demo/linkkit_example_solo.c中填写了正确的四元组信息,HaaS100语音播放器才能正确连接用户自己账号的阿里云物联网平台。

* "ProductKey":用户创建的产品类型的Key(唯一ID)

  • "ProductSecret":用户创建的产品类型的密钥(和ProductKey一一对应)
  • "DeviceName": 该产品类型下的某个具体设备名字(某个产品类型下可以有很多量产设备)
  • "DeviceSecret": 该产品类型下的名字为DeviceName设备的密钥(和DeviceName一一对应)

阿里云物联网平台获取四元组信息页面:

**备注**:修改完四元组信息之后,别忘记参考2.3章节重新编译、烧录HaaS100固件。

4.3.2 钉钉小程序设计

文章《30分钟上手HaaS小程序开发》, 文中介绍了小程序开发工具IDE、HaaS钉钉小程序示例代码获取、钉钉小程序申请、小程序真机调试等基础内容。开发者可以根据这篇文章快速上手一个自己的小程序应用开发。

下载的“HaaS钉钉小程序示例代码”中包含了“HaaS智能语音播放器”示例源码(开源披露流程中,敬请期待)。HaaS语音播放器中创建了2个page,分别是HaasAudioPlayer和playList。

* HaasAudioPlayer页面功能有:加载/卸载HaaS100声卡,打开/关闭录音,TTS语音合成入口,当前播放音乐的基础信息(歌曲名、歌手名、专辑图片),播放模式选择,音效选择,音量控制,播放控制(播放、暂停、上一首、下一首)以及播放列表入口。

  • playList页面:自动从./mock/data.json中导入用户与设置好的播放列表信息。

要成功使用HaaS智能语音播放器小程序,开发者需要正确输入用户以下用户信息,

4.3.2.1 accessKey信息

* accessKeyId

  • accessKeySecret

这是钉钉小程序访问用户“阿里云物联网平台”账户的密钥信息,修改代码路径是./pages/app.js。 密钥信息修改位置参考

4.3.2.2 产品信息

* DeviceName

  • ProductKey

这是钉钉小程序需要控制的用户物联网平台中的某个HaaS100设备。修改代码路径是./pages/HaasAudioPlayer/HaasAudioPlayer.js。 HaaS设备的密钥信息修改位置参考

4.3.2.3 修改播放列表

开发者可以自己修改歌曲播放列表,配置文件位于./mock/data.json。每首歌曲信息包含:

* id: 歌曲在播放列表中的id

  • copyrightId:歌曲版权信息,可忽略
  • picS: 歌曲在播放页面中显示的图片信息
  • songName: 歌曲名
  • singerName: 歌手名
  • url: 歌曲链接,可以是本地文件系统中的歌曲文件,例如fs:/data/6.mp3,也可以是浏览器可以直接播放的网络歌曲链接。

5、总结

本文提供了“本地”和“云端钉一体”两种调试语音播放器的方式,本地的方式可以快速验证硬件和端测软件的基础功能是否OK,云端钉一体的方式让用户在任何一款手机、平板设备上都可以通过支付宝或者钉钉小程序远程控制HaaS100音乐播放器,更具有可玩性。祝您体验HaaS云端钉一体智能语音播放器方案愉快。