人类大迁徙 语音大迁徙



     在街头如果想起了好友,你可以对着手机说“动态消息”,那么它会帮你打开所有动态新闻链接;如果说“附近的朋友”,那么它会告诉哪些好友在你的附近;如果你说“朋友的音乐”,那么它会为你播放你最近和好友分享的音乐,总之包括朗读新的订阅消息、短信息、日程安排、更新自己的状态、查看在线好友、查看附近的人等等,你可以听一切Facebook上的内容——这是最近在都柏林网络峰会上发布的一款应用WonderVoice。尽管这款应用仍然无法让手机理解诸如“我的朋友现在在干什么?”之类的具体问句,但是面向社交网站的语音应用却让人耳目一新,对于年轻人来说,用语言进行交流,听到朋友的声音比看简单的文字更有趣。

  自从2010年,Siri这个由苹果与全球最大的语音识别厂商Nuance合作整合的语音助理推出之后,短短两年时间里,Siri已经成为最炙手可热的技术产品,Siri代表的语音控制和人工智能就被科技界备加推崇。去年10月苹果公司在iPhone 4S上推出Siri这款语音控制应用之后,今年最新推出的IOS6.0中进一步升级了Siri,在其支持的15个国家和地区语音中,特别增加了中国普通话、粤语和闽南话。

  科技巨头们早已发现了语音助理背后的商机。Siri的价值远远超过一个语音识别软件,作为用户的私人生活助手,让用户通过手机读短信、询问天气、语音设置闹钟等,还可以通过Siri搜索餐厅、电影院等生活信息,直接收看各种相关评论,并且进行预定,而且随着Siri越来越智能,针对用户询问给出的回答,不断学习心得声音和语调,Siri将会绕过搜索,掌握用户的更多浏览行为数据以及与siri相关无限量应用都显示出未来将迎来爆炸性的增长。

  事实上,语音已经成为今年最热的技术趋势之一。《连线》杂志在评选siri为2011年5大具有深远影响科技事件之一,而其创始人凯文·凯利在公开演讲中把语音和手势这样的互动在科技中的应用看作是影响未来20年网络世界的重要趋势。

  语音是人类社会最基本最自然的交流工具之一,也是创造人类的一个拐点,语音将我们的思想转化为符号,并指导和控制我们的行为。当电脑诞生之后的相当一段时期里,人们都是运用手指敲入符号来与机器交流, Siri与iPhone 4S整合给业界带来了很大的惊喜,电脑终于可以通过自然的语音与人类互动了,而今对于移动互联网和智能手机而言,语音将是人类进行互动的效率更高更自然的工具,仿佛让机器也具有了生命。

  也许,对于很多技术人来讲,语音产品仍然是美丽的陷阱,从上世纪90年代末IBM公司发布的ViaVoice 98 连续语音识别产品, 到2006年比尔.盖茨预言未来将在操作系统中实现自然语音的人机交互,并支持微软收购了TeLLME,掀起的语音热潮,无数实验室和技术人员前赴后继地投入到语音控制与人工智能的幻象之中,语音控制一直没有真正步入人们的互联网生活。不过今天,日益成熟的移动互联网环境、云计算和大规模数据的积累,以及大量智能终端的普及都让语音的世界真正临近爆发。不久前,IBM超级计算机“沃森”(Watson)在智力竞答节目《危机边缘》对海量数据信息迅速完成分析的能力,iOS系统的风行,各种语音应用的崛起都让人不禁对语音和人工智能软件嵌入到流行电子消费产品后的前景充满期待——2013年大量的应用开发商、终端移动设备和用户都将开始向语音和人机交互的生活领域迁徙。

  争夺入口

  Yelp的联合创始人兼CEO杰瑞米·斯托普尔曼(Jeremy Stoppelman)是苹果各种活动的常客,在外界看来,消费者点评网站Yelp已经成为苹果对抗谷歌的重要武器。苹果在Siri后端链接了知识引擎Wolfram Alpha并集成了餐馆点评网站Yelp、电影点评网站Rotten Tomatoes和餐馆预订服务OpenTable等大型消费内容网站,让用户可以使用Siri直接搜索所需要的餐馆、酒店等生活信息,查询附近的餐馆时,帮助用户做出最便捷的选择。

  而Yelp也同样借助Siri成为美国,最有价值的消费内容网站。从2010年开始,Yelp开始加速扩张,覆盖位于美国本土的20多个地区和加拿大、欧洲等地区,商家服务范畴也从餐饮、购物扩展到包括牙医、机械师、水管工等家庭生活服务的各个领域。人们通过Siri随意搜索,就能快速查找到这些日常信息,这也是绕过谷歌这些传统搜索引擎,也分食谷歌的核心业务的广告收入。“苹果采取不同的策略,专注于搜索宇宙中的一个子集,与谷歌的竞争的不是关键字,而是争夺细化执行每天数以百万计的搜索算法。”亚马逊搜索部门前高管,风险投资家David Tennenhouse说,“餐馆,电影,体育,商家信息,地图和位置 ——这些垂直行业的搜索最理想的方法是快速,易消化的结果,而不是谷歌。”

  很快谷歌就意识到了Siri的威胁,谷歌执行董事长埃里克施密特(Eric Schmidt)公开表示出苹果的语音助理服务Siri有可能威胁谷歌的搜索业务。谷歌仍然是搜索引擎的霸主,谷歌每月的搜索量高达1000亿次,但是不能够清楚地理解你的意思并且能够给出最想要的结果,用户将会最终抛弃谷歌而选择其他入口,这也是谷歌随后推出Google now的动力。今年谷歌也面向移动领域推出了足够令业界震撼的Google Now语音识别搜索服务,这是谷歌继Google Voice Search之后面向移动互联网的又一战略性产品。另外,谷歌在语音导航服务上也与苹果决裂,苹果不得不在iOS 6中放弃体验更好的谷歌地图而使用自家地图服务,此前,苹果希望在iOS 6中提供免费的语音导航服务,而谷歌则坚持,语音驾驶导航将是移动版地图服务中一项少见的可以收费的项目,施密特要让苹果看到语音导航绝对是未来争夺用户一争高下的“杀手锏”。

  同样,微软也在Win8和最新的Surface平板电脑中整合了语音识别技术的全新系统,希望借助Kinect软件开发包作为微软明年最重要的利润增长点之一。不久前,微软首席执行官鲍尔默表示,微软从来没有放松对语音和人工智能的研究和巨资投入,微软未来的重点是开发一种全新的触摸、手势和语音的自然操作方式,接下来Kinect系统将支持Win8系统,PC和移动设备都将呈现几乎与Siri类似的体验,更不要说微软正在全力支持的搜索“必应”。就连三星、联想等终端厂商也开始推出类似Siri的语音辅助软件,显然语音已经是各大平台公司集结的战场。

  如果说语音帮助苹果绕开谷歌和传统的关键字搜索,不如说语音作为一种输入和控制的自然工具将是未来搜索的重要装备,将掌控未来移动互联网的入口。“这个入口可以是用户开启自己的手机终端的入口,也可以是遨游移动互联网的统一入口。”百度公司负责多媒体业务的余凯博士解释说,比如就单机而言,用户通过声纹登录自己的手机,用户的声音和设置的语言就是双重密码,用户也可以直接通过语音直接调用手机中的联系人信息,以及手机中的视频文件等。

  而在移动互联网入口上,百度把语音看做是是跨领域资源整合的纽带。比如,最近百度歌曲搜索已在公司内部开始测试,这也被认为是百度在语音识别搜索领域,首次进行尝试和探索。在未来的语音搜索中,如果你听到一首好听的歌曲,却不知道歌曲名称,完全可以对着电脑哼唱一段歌曲就搜索到,或者系统会自动搜索含有相关歌曲曲调的文件提供给用户;如果这个文件或者应用时来自互联网和其他公司的资源也可以进行调用,或者由语音直接导入相关第三方App,如同余博士所说,百度通过把语音加入到全面开放的云平台,来聚集更多第三方开发者利用这些免费提供语音技术进行开发,也就是围绕语音建立了一个生态系统,后台整合足够的本土资源,才能超越苹果和谷歌。

  “在百度即搜即用的概念下,所有服务都将有一个语音的外壳,等待语音的钥匙开启”。余凯博士说,语音是百度未来最重要的技术高地之一,在广义的语音移动搜索、垂直搜索、语音输入法等多个产品领域进行基础应用开发外,还将重点发展语音指令和框搜索。这将是百度实质性掌握语音入口的关键。

  终端诱惑

  最近应用开发商Viper对smartstart智能汽车控制应用进行更新,加入了对Siri语音指令平台的集成,用户可以在搭载iOS 6的iPhone 4S或者iPhone 5手机上,直接通过Siri平台来启动SmartStart应用程序。在启动应用之后,汽车也就会被启动,同时还可以对车门进行锁定或者解锁操作。想象一下,如果他人尤其是家中的小孩,因为失误或者调皮启动了停在车库中的汽车,那么用户就可以利用SmartStart的远程控制功能,对汽车进行锁定或者解锁操作,天冷时,驾驶员完全可以在出门前5分钟提前启动汽车,如果遇到紧急情况需要提前离开,用户完全可以将车停留在停车场,并且不需要把钥匙寄存在第三方的手中,其他人只需要利用手机来控制汽车,就可以把车开走。作为驾驶员和汽车的信息交换平台,smartstart给用户增加了独特的价值,用户只要用智能手机和语音就可以轻松完成对爱车的远程控制。

  语音对于汽车的诱惑更多来自于导航,有了语音导航,就相当于给路痴们提供了一个道路向导,一个与汽车融合的语音系统可以比单独电子导航仪更好地操控汽车。因此,大部分汽车企业都在自有语音导航领域投入了相当大的开发费用,比如,宝马的前期投入巨大,宝马的“语音控制系统”最多可识别500个预设词条,可操控电话、空调、导航和音响系统等功能。免提麦克风既可收音,还可以过滤掉背景噪音,这项技术已经成为宝马少数几款高端车的奢华配置;福特的语音导航系统也以服务免费,升级方便,可扩展性强等特性作为杀手锏,而荣威的InkarNet也借助科大讯飞的语音技术搭建了一套独特的语音导航系统在汽车领域一枝独秀。

  事实上,移动互联网时代需要通过按键或者触屏的传统方式完成的操作开始偏向于更为方便的语言控制化,类似于Siri这样的语音助手功能已经开始普及,越来越多的应用程序也都开始加入语音平台指令集,而未来的手机、汽车、电视每个终端都可以通过声音进行各种个性化的操作,不少国内终端厂商已经把宝压在了语音上。

  此前,联想集团CEO杨元庆在联想移动互联战略发布会上表示,他非常看好并看重语音功能,联想在中文语音交互领域,将不会落后于其他厂商。联想集团几年前就已经开始语音技术的研发,联想最新推出的乐Phone系列智能手机已经具备简单的语音命令功能,未来会在各种核心应用上完善语音控制。

  而家电厂商方面,“内置Ciri语音智能交互”的语音电视就是今年长虹公司的重头戏。据介绍,语音智能电视不用遥控器,仅凭语音指令就能完成换台、电视节目查询、网络浏览/搜索、文字输入等各种操作。用户只需告诉语音电视要做什么,电视就可以快速地为用户切换到相应的应用界面,彻底解放用户的手脚。长虹在科大讯飞的语音识别系统上面研发的语音交互系统,让语音电视还可以辨别男女不同的嗓音,根据声音判断用户的年龄,与各年龄段的用户“贴心”交谈,还特别搭配了东北话、重庆话、湖南话、粤语等地方方言,让电视更准确地理解用户的需求。

 人类大迁徙 语音大迁徙
  押宝在智能电视,而不再追寻日韩企业在屏幕画质上面做文章是需要魄力的。长虹就认为,电视机的大屏幕,高画质是其他的终端无法替代的,要想提高电视作为终端的吸引力必须要实现人机交互,必须改变电视作为终端的封闭和单向,被动式传播方式。因此,现在越来越多的彩电企业把关注点从屏幕转移到应用上,更多智能电视终端厂商投靠谷歌,而语音、智能、人机交互功能将为彩电行业将迎来用户体验时代。

  显而易见,在未来科技公司围绕系统、硬件、服务器和云的平台战争中,语音正是未来平台竞争的重要一局。

  

爱华网本文地址 » http://www.413yy.cn/a/9101032201/48800.html

更多阅读

角马为什么要大迁徙? 角马大迁徙

在世界最大的野生动物保护区马赛马拉,每年都会上演世界上最壮观的自然奇观,那就是举世闻名的动物大迁徙。从7月到10月,百万头的角马,数十万计的斑马、羚羊、上千万只火烈鸟,组成声势浩大的队伍,从南面的坦桑尼亚的塞伦盖蒂保护区前往肯尼亚的

安妻BY李小雾强推! 安妻by李小雾 番外

文案:时光消逝,人类发展的进程早已经远到外太空,而当代人们所关注的国家,人种,甚至性别也早已经湮灭在流逝的时光了。地球经过数万年人类的过度开发也已无法承受分崩离析,而人类则迁徙到了另外的星球。只是万年

春运迁徙——生命中不能承受之重 春运大数据 百度迁徙

米拉网原创文章 转载请注明“春运”被誉为人类历史上规模最大的、周期性的人类大迁徙。40天左右的时间里,将有高达20多亿人次的人口流动,相当于世界人口的三分之一的集体旅行,试问这样的规模谁能承担的起?转眼,春节己将近,车票成为了所

声明:《人类大迁徙 语音大迁徙》为网友与我相关分享!如侵犯到您的合法权益请联系我们删除