慧编程人工智能教程系列之一：小熊猫变身Dr.Know

2019-09-09

著名导演史蒂文·斯皮尔伯格曾经拍过一部《人工智能》的电影。这部电影在当时引起了很大的轰动，其中的Dr.Know（万事通博士）更是给观众留下了深刻的印象。

这位Dr.Know可以说是博学多闻、无所不知。你可以问他任何问题，他都能给你答案。

（图片来自网络）

你有没有发现？这部科幻电影里的Dr.Know很像我们现在手机上用的智能语音助手，通过“语音交互”，它能跟你进行日常的对话，给你想要的信息，甚至完成你想要做的一些事情。

今天，让我们一起来更全面地了解和使用慧编程的“语音交互”功能吧~

（图片来自网络）

No.1

语音交互的原理

想实现语音交互，需要经历至少以下四个步骤：
语音识别：将麦克风采集到的人声转化为文字。
自然语义理解：将输入的文字，按照句法、词法结构，分解成有意义的特定词组。
自然语言生成：由计算机将各种词组拼接成能具有意义的句子
语音合成：将文字合成声音并播放出来，并尽可能地模仿人类自然说话的语音、语速、语调、音量等，给人以交谈的感觉。

No.2

语音交互的应用

语音交互目前最广泛的应用是语音助手和语音机器人，比如苹果Siri、亚马逊Echo、微软小冰、三星Bixby、天猫精灵、小度音箱等，它们不仅能够在一定程度上准确地识别语义，还可以与人进行即时问答，帮助用户解决打电话、发短信、订外卖、设置事件提醒等实际问题。

No.3

添加语音交互积木

1）打开慧编程（PC端或Web端都可以），在“角色”下，单击积木区最下方的“添加扩展+”

添加语音交互积木

2）在弹出的“扩展中心”页面，选择“人工智能服务”扩展，点击“+添加”

3）返回编辑页。现在我们发现多了五类积木，其中一类积木是“语音交互”积木

No.4

积木详解

1）麦克风在一定时间内（2秒或5秒内）获取录音，并对检测到的录音（普通话、英语、粤语或四川话）进行识别。注：该积木主要识别中文语系，外文语系识别请使用“认知服务”扩展内的语音识别积木，如下图所示：

2）保存语音积木识别出的结果，但只保存最近一次的识别结果。如果没有任何识别结果，则保存空值。该积木输出数据类型为字符串。勾选积木前面的小方框后，语音识别结果会在舞台上呈现舞台呈现效果：

3）麦克风（默认使用【标准男声】【语速 5】【语调 5】【音量 5】）朗读用户自定义的文本
注：当积木执行后，会顺序执行下面的积木，不会等待完整朗读完

例：

这组程序的执行逻辑是：开始朗读文字 → 左转→ 重复开始朗读文字（打断前面的朗读）

4）麦克风（默认使用【标准男声】【语速 5】【语调 5】【音量 5】）完整朗读用户自定义的文本

注：当积木执行后，会完整朗读完后再进行下面的语句

例：

这组程序的执行逻辑是：开始朗读文字（完整读完） → 左转 →开始朗读文字（完整读完文字）→左转

5）用户可以对麦克风朗读的发声人（标准男声、标准女声、情感男声、情感女声）进行设置

6）用户可以对麦克风朗读的语速或者语调或者音量进行设置（范围均为0~15）

No.5

使用语音交互积木

案例：小熊猫变身Dr.Know（万事通博士）

对语音交互的介绍到这里就结束啦，你可以打开慧编程，试试创作更多有趣的语音交互作品。

对了，有个小小的提醒~

有小伙伴在使用“语言交互”的过程中，可能会遇到语音识别不成功的情况，我们建议你：
选择在安静的地方进行语音识别，避免周围噪声带来的干扰；
尽可能靠近麦克风，保证录音清晰；
尽量说一个完整的句子，让机器更容易根据上下文识别准确的字词；
使用标准的普通话录音，不要夹杂方言（粤语和四川话除外哈哈哈，这两个慧编程已经支持啦~）。

最后想说的是，随着语音交互技术日趋成熟和完善，我们相信，在未来，语音交互会在各个领域展现出更多的可能性。毕竟，无论多繁杂的操作步骤，你可能只需要一个语音指令就可以完成啦！

人工智能教程
导论：当人工智能教育走进中小学，我们可以怎么教？
文/编辑：Yanyan技术指导：Hyman、郝威