自媒体

智慧语音何时才能颠覆人机交互模式?

字号+作者:鼎读财经 来源:分享财经网 2021-12-07 08:47:18 收藏成功收藏本文

物极必反,乔布斯在世当初就已经认识到了“触控”这种人机交互方式的局限性。2010年,iPhone 4搭载Siri横空出世,乔布斯希望以此开启人工语音智能的人机交互'...

物极必反,乔布斯在世当初就已经认识到了“触控”这种人机交互方式的局限性。2010年,iPhone 4搭载Siri横空出世,乔布斯希望以此开启人工语音智能的人机交互革命。然而,当...

2007年,乔布斯推出第一代全触控iPhone以来,苹果便在黑压压一片键盘按键手机中寻找到了一条全新的人机交互道路。早期的苹果iPhone产品改变了用户对触屏手机的理解,重新定义了触屏手机体验,从此触控手机正式登上历史的舞台。

8年后的今天,智能手机依旧被第一代iPhone所革新的触控操作所深深影响。放诸全球,任何一款智能手机都逃不过直板+触控屏的造型。然而 触控 也将智能手机外型以及人机交互体验带入同质化的怪圈。

物极必反,乔布斯在世当初就已经认识到了 触控 这种人机交互方式的局限性。2010年,iPhone 4搭载Siri横空出世,乔布斯希望以此开启人工语音智能的人机交互革命。然而,当时的Siri只能做到取悦用户,发布仅仅数月后,绝大部分用户对Siri功能失去新鲜感。与iPhone4的革命性意义相比,被寄予厚望的Siri显得如此不堪。此后,智能手机搭载的人工语音智能停滞不前,无论在实用性还是功能性方面都难有突破,彻底沦为炫机的鸡肋功能。

2015年的今天,人工语音智能这种人机交互方式是否还具有现实意义,人工语音智能将引领人机交互及通信行业走向何方?这成为了手机行业正在思考的难题。

人工语音智能困局

目前,大多数人工语音智能对于自然语言识别率已经达到了一个较高的水准,对于常用的手机语音操控短句识别率较高并且拥有极高的响应速度。但是,识别并不等同于理解,对于一些复杂句式的长句,在人看来很正常很容易理解,机器可能就无法理解。重复几次失败后,人们自然会对这种理解能力的东西意兴阑珊了。

除此之外,手机使用的场所十分多变,有可能时常处于声音极其嘈杂的环境下,这就要求较高的智能设备降噪能力。目前大多方案还停留在实验阶段,导致技术层面存在突破瓶颈。另外,现行的语音操作过程甚至还强迫用户手动辅助完成,但语音交互的根本目的在于解放人的双手,人机的语音交流应该是具备相较于 触摸 更远的交互距离。这造成了人工语音智能应用致命性的缺陷。

而罗永浩在锤子Rom发布会则用 使用者的心理障碍 概括了人工语音智能的窘境。 你在前后都挤满人的公共汽车上,掏出手机说 请给老王发一条短信,边上人都用傻叉一样的眼神看着你的时候,你就会明白,语音识别软件公司首先要解决的是心理学问题而不是语音识别技术问题。

切合语音应用场景

综合以上原因来看,以往人工语音智能都在不恰当的应用场景进行探索,自然会出现不实用的困局。而语音识别应用的场景这是由声音的公开性以及人的保密心理天然限制的。目前,国内语音产品开发厂商以及手机厂商显然都还未意识到这些问题。

要想改变人工语音智能当前这种鸡肋的状况,还是要从恰当的应用场景出发,进行相关功能的开发。首先,使用人工语音智能应该围绕 解放双手 这一逻辑上进行拓展。除了 解放双手 以外,人工语音智能更要 延展人体 ,在无法使用双手的应用场景下实现人机交互。一旦厘清了人工语音智能这两条发展道路,产品发展思路也就随之清晰。

在 解放双手 这个层面上,人工语音智能在与人的交互上应该做到无需上手,只需要简洁的语音口令就实现绝大多数的手机使用场景,也就是说用语音口令代替手机的机械对话和触控。而在 延展人体 这个层面上,人工语音智能则可以在汽车驾驶、同声传译等方面帮助用户提高生产力。

行业内的有益探索

目前,在人工语音智能这一领域,苹果、谷歌、微软以及国内部分手机企业都在进行人工语音智能和人机交互方面的探索和结合。

谷歌、微软分在实用性和人工智能大数据领域拓展人工语音智能。谷歌的Google Now在兼顾日常生活助理的同时,通过语音寻找手机、语音唤醒以及手势操作等功能开创性地丰富了人机交互方式。2013年摩托罗拉推出的旗舰Moto X采用这一技术,通过全程语音指令惊艳四座。苹果在2013年6月也涉足汽车领域的人工智能,推出了 iOS in the Car 技术,通过Siri语音操作可以实现导航、通话、音乐播放等服务。

而在国内,中兴星星2号手机搭载智慧语音系统,在人机交互方面一骑绝尘。 解放双手 这一层面上,星星2号手机只需通过 驾驶 、 音乐 、 拍照 这些简洁而直接的口令实现人机交互。而通过语音驾驶模式,配合手机自身导航、GPS定位、娱乐等功能,形成了一套完整的车联网解决方案,实现人、汽车和手机的互联互通。星星2号得语音翻译功能更为出国人士提供同声传译服务,快捷高效。

总结:

对于语音操控,前微软公司董事长比尔 盖茨在美国卡内基-梅隆大学发表演讲时表示,语音技术等自然交互技术将在不久的将来成为电智能硬件的重要功能。他认为,未来几年,互联网搜索将更多通过语音命令来完成,而不仅仅是语音识别。从简单的语音识别到智能化的人机语音交互,是语音技术未来发展的关键。

2014年,苹果、谷歌、微软三家依旧在语音智能领域深耕。但是,三家大厂依旧未能让人工语音智能全面颠覆人机交互方式。随着智能手机的发展,关于语音交互的革命仍然会继续,这将是一场持久战。人工语音智能真正成熟之时,将给人类带来革命性的科幻体验,而智能手机也将呈现出更加具有想象力的形态。

1.鼎读财经网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.网友所投稿件只代表发稿人立场,如果内容或配图侵犯了您的利益,请联系发稿人或本站编辑3123658318@qq.com 进行删除。

上一篇:小米看懵了,魅族吃了豹子胆竟然率先攻进美国市场下一篇:2014十大游戏事件:端游厂商的转型答卷与陈天桥的离场