著名导演史蒂文·斯皮尔伯格曾经拍过一部《人工智能》的电影。这部电影在当时引起了很大的轰动,其中的Dr.Know(万事通博士)更是给观众留下了深刻的印象。
这位Dr.Know可以说是博学多闻、无所不知。你可以问他任何问题,他都能给你答案。
(图片来自网络)
你有没有发现?这部科幻电影里的Dr.Know很像我们现在手机上用的智能语音助手,通过“语音交互”,它能跟你进行日常的对话,给你想要的信息,甚至完成你想要做的一些事情。
今天,让我们一起来更全面地了解和使用慧编程的“语音交互”功能吧~
(图片来自网络)
No.1
语音交互的原理
想实现语音交互,需要经历至少以下四个步骤:
语音识别:将麦克风采集到的人声转化为文字。
自然语义理解:将输入的文字,按照句法、词法结构,分解成有意义的特定词组。
自然语言生成:由计算机将各种词组拼接成能具有意义的句子
语音合成:将文字合成声音并播放出来,并尽可能地模仿人类自然说话的语音、语速、语调、音量等,给人以交谈的感觉。
No.2
语音交互的应用
语音交互目前最广泛的应用是语音助手和语音机器人,比如苹果Siri、亚马逊Echo、微软小冰、三星Bixby、天猫精灵、小度音箱等,它们不仅能够在一定程度上准确地识别语义,还可以与人进行即时问答,帮助用户解决打电话、发短信、订外卖、设置事件提醒等实际问题。
No.3
添加语音交互积木
1)打开慧编程(PC端或Web端都可以),在“角色”下,单击积木区最下方的“添加扩展+”
3)返回编辑页。现在我们发现多了五类积木,其中一类积木是“语音交互”积木
No.4
积木详解
1)麦克风在一定时间内(2秒或5秒内)获取录音,并对检测到的录音(普通话、英语、粤语或四川话)进行识别。注:该积木主要识别中文语系,外文语系识别请使用“认知服务”扩展内的语音识别积木,如下图所示:
2)保存语音积木识别出的结果,但只保存最近一次的识别结果。如果没有任何识别结果,则保存空值。该积木输出数据类型为字符串。勾选积木前面的小方框后,语音识别结果会在舞台上呈现舞台呈现效果:
3)麦克风(默认使用【标准男声】【语速 5】【语调 5】【音量 5】)朗读用户自定义的文本
注:当积木执行后,会顺序执行下面的积木,不会等待完整朗读完
例:
这组程序的执行逻辑是:开始朗读文字 → 左转→ 重复 开始朗读文字(打断前面的朗读)
4)麦克风(默认使用【标准男声】【语速 5】【语调 5】【音量 5】)完整朗读用户自定义的文本
注:当积木执行后,会完整朗读完后再进行下面的语句
例:
这组程序的执行逻辑是:开始朗读文字(完整读完) → 左转 →开始朗读文字(完整读完文字 )→左转
5)用户可以对麦克风朗读的发声人(标准男声、标准女声、情感男声、情感女声)进行设置
6)用户可以对麦克风朗读的语速或者语调或者音量进行设置(范围均为0~15)
No.5
使用语音交互积木
案例:小熊猫变身Dr.Know(万事通博士)
对语音交互的介绍到这里就结束啦,你可以打开慧编程,试试创作更多有趣的语音交互作品。
对了,有个小小的提醒~
有小伙伴在使用“语言交互”的过程中,可能会遇到语音识别不成功的情况,我们建议你:
选择在安静的地方进行语音识别,避免周围噪声带来的干扰;
尽可能靠近麦克风,保证录音清晰;
尽量说一个完整的句子,让机器更容易根据上下文识别准确的字词;
使用标准的普通话录音,不要夹杂方言(粤语和四川话除外哈哈哈,这两个慧编程已经支持啦~)。
最后想说的是,随着语音交互技术日趋成熟和完善,我们相信,在未来,语音交互会在各个领域展现出更多的可能性。毕竟,无论多繁杂的操作步骤,你可能只需要一个语音指令就可以完成啦!
人工智能教程
导论:当人工智能教育走进中小学,我们可以怎么教?
文/编辑:Yanyan技术指导:Hyman、郝威