用语音导航开车的人,一定遇到过机器听不懂人话的情况。
分分钟血压飙升,路怒症都被激发出来。
人工智能不愧被调侃为人工智障。不过咧,这都是站在人类视角上来评判的。
机器跟人类交流需要通过一套系统:自动语音识别系统(ASR),机器通过ASR来识别并理解人类语言,然后做出语音反馈。
无非就是听和说嘛,听起来很简单对不对?但是这个能力对一个健康人类来讲就是标配!然而,机器表示:
机器跟人类交流的难点,主要集中在[听]上
难点1:转换声波
声音是靠声波来传递,当你对机器说话的时候,机器接受到的首先是声波,机器需要把声波转化成数字来识别内容。
难点2:区分噪音
站在机器的角度,它除了接收到你的声音,还有关门的声音、骑车按喇叭的声音、周围人交谈的声音等等。它需要从混乱嘈杂的噪音中,识别你的声音和内容。
难点3:音色辨识
人说话的音色是多种多样的,男人、女人、老人、小孩的发音不同,难度更大的还有方言口音。这都是机器面临的挑战。
难点4:适应语速
机器还需要适应语速。语速过慢的情况下,机器需要识别完整的句子结构,判断人是否讲完。
例子:
A:这瓶酒多少钱
B:8万
A:开….
(B把酒开了)
A:...开….开什么玩笑!
难点5:无意义词汇
我们人在说话的时候,会用很多过渡性的语气助词,例如“嗯”“啊”“昂”等。
难点6:同音异意
语言中有很多同音词,机器需要联系上下文,判定说话者的意图。请细品以下例子。
例子:你方便吗?你在方便吗?你吃方便面吗?
看吧,还是不简单,如果能够让机器学会跟人类正常交流,那也是一件超酷的事儿。AIOC有AI方面的学习课程哦~