人工智能语音识别技术已经被广泛运用到人们的日常生活中。一些人们常见的电子产品,都拥有语音识别技术,提高人们工作、生活效率的同时,也给人们的工作、生活方式带来了很大改变。
那么,什么是语音识别?
语音识别指的是计算机通过获取并识别语言输入信号,将其转换为相应文本的技术。但是,它又不单单是要计算机能够正确转换语音信号输入,同时,还要能够获取其中的主要信息,并执行指令。简单地说,就是让计算机“知道”我们说了什么,并且“执行”我们给它的指令。
对于在中小学开展人工智能教育的老师们来说,很可能会遇到的就是如何引导学生们了解【语音识别】技术,毕竟,这一技术在人工智能领域正逐步成为信息技术中人机接口的关键。因此,把语音识别技术的应用与课堂教学结合起来,具有很强的教学实践意义。
在i少儿编程软件慧编程里,我们可以通过使用【人工智能服务】扩展里的【语音交互】积木块,实现语音识别的实际应用,帮助学生更好地理解语音识别技术的底层逻辑。
慧编程人工智能应用-语音控制mBot
01 准备工作
准备一台有麦克风功能的电脑
下载慧编程或者登录慧编程网页端
02 实现步骤
步骤1:添加舞台角色
打开慧编程,我们切换到角色栏,添加一个mBot舞台角色。
步骤2:添加扩展
在积木分类栏的下方,有一个扩展添加按钮
点击后会弹出舞台角色可以使用的扩展列表,找到【人工智能服务】扩展,点击添加
该扩展包含多种人工智能技术,语音、图像、自然语言处理等都有涉及,用来做人工智能教学非常方便。
添加完扩展以后,你会在积木栏发现,多了很多积木类别,像 【语音交互】、【文字识别】、【图像识别】、【人体识别】、【自然语言处理】。这里我们只用到语音交互中的语音识别功能,其他功能后续会讲解。
我们会发现语音识别中可以识别到:普通话、英语、粤语还有四川话,不同语种你都可以尝试一下~
步骤3:构思程序
语音识别的主要原理,如图
我们利用获取到的文字内容,进行文字关键词匹配,设计相应的执行指令。
基于以上原理,我们利用语音识别积木块来做语音采集、音频数据处理,并输出文字内容
步骤4:程序关键源码实现
有了以上的广播,我们可以在慧编程中,用Scratch语法,接收到广播信号时,执行对应的动作指令。例如控制mBot的运动。
我们做了一个虚拟的mBot运动游戏,大家也可以加上mBot硬件设备来扩展玩法。
*关注“童心制物STEAM教育研究院”微信公众号,在后台回复“语音”即可查看示例作品,还能一键查看完整程序!