用淘宝模式做音箱 语音交互对阿里意味着啥

【2018-01-17】

  用淘宝模式在阿里说话人语音交互意味着什么

  7月5日,阿里巴巴首个人工智能音箱:天猫精灵X1正式登陆,此前接口消息报道了这款人工智能音箱的定价,基本硬件参数,阿里巴巴AI实验室负责人陈丽娟告诉新闻记者,除了市场上常见的内容广播,提醒设置,闹钟天气等外,还将在购物场景中引领行业平均水平。例如,179.99美元的亚马逊Echo购物或留在主购物车中,而阿里的“Lynx Wizard X1”音箱已经能够完成从积压购买的记录,从最终付款中选择订单付款全过程,这主要是因为它配备了内置的第一代中国人机通讯系统AliGenie,这是阿里首款正式发布的智能扬声器产品和中国人机交换系统。这个演讲者的诞生也代表了阿里对语音交互的重视,体现了它试图抓住物联网门户。淘宝网上的千货,语音互动产品如何挑选消费者想要的产品?陈丽娟表示,该产品具有“决策权“,它将学习到消费者的购物习惯,了解用户的肖像,然后有意向推荐,阿里在电力领域长期积累的技术优势可以直接用在语音交互场景。中国和美国的家庭环境差异很大,所以把Amazon Echo和苹果的HomePod直接推向中国市场可能不太受欢迎。美国人使用频率最高的智能扬声器现场是在厨房里,烹饪时间需要设置一个倒计时,对于国内市场来说,智能硬件设备差别很大,而中国用户需要一个对中国人语音友好的助手级“全能产品”,语音交互拆解的角度来看,可以分为语音识别,语音合成和自然语言处理,每个区块可以分为更详细的处理步骤,国内语音产业公司大多停留在语音输入法(如IFT)或语音搜索等方面,真的可以进行语音交互式的商业化除了产品层面之外,自然语言处理(NLP)仍然是人工智能行业最具挑战性的部分,阿里看中了这样一个市场机会和行业出路。李人工智能实验室主任陈丽娟是淘宝首批产品经理。按照阿里通常的方法,这种人工智能扬声器也采用了“淘宝模式”,就是开发人员足够友好,开放的API接口,可以接入各种智能设备和软件App,这完全不同于苹果的“ HomePod。出于安全原因,Apple要求连接到Homekit平台的所有设备都加载一个特殊的MFi芯片,这无意中增加了硬件启动访问Apple设备的成本。据接口新闻记者了解,阿里生态环境的支持将成为这位演讲者优势的核心。在软件层面上,阿里扬声器有阿里娱乐系统内容支持,如优酷视频内容转录;目前第三方应用程序在陆续改编,如健身软件Keep和喜马拉雅FM等。在硬件方面,阿里智能IoE接入,目前正在谈论包括古北技术,涂鸦技术;类别共有100多个,阿里生态环境将会得到这个扬声器核心优势的支持,阿里鼓励用户建立自己的“语音公众号”,这部分更多是针对个人的,在辅助应用中,用户可以输入自己的音频文件,在后台直接播放,将来也可能会尝试付费模式,鼓励用户充分建立自己的语音信息,应用到具体的场景,虽然这个产品的名字是链接到“山猫”下面,但足以看到阿里对语音交互的重视,在几乎所有互联网公司都承认的这场技术大战中,阿里不愿意落在后面,阿里巴巴的技术团队传出这样一句话:“阿里巴巴的业务掩盖技术亮点。“无论是对还是错,至少这代表了阿里的技术自信心。阿里巴巴的语音识别技术早已存在,但尚未公布。在客户服务系统中最早的应用,是因为客服是语音部门最多的联系人,客户每天打来客服质量检查,手动质量控制效率低下,需要识别语音技术,变成文本版本是语音技术现场的第一个应用。在天猫淘宝App中,已经嵌入了语音搜索功能,神马搜索还采用了语音搜索技术。虽然识别的准确性有待提高,但这些都表明阿里的语音互动产品已经积累多年,可以用于各种产品和场景中,陈丽娟接受采访时强调,智only只利用其六个麦克风阵列架构设计,语音交互是阿里的核心技术之一。在收集语料时,所有的材料都是在阿里的产品上使用的,淘宝每月有4.5亿人生活,其中只有1%的人使用语音搜索,对语料的训练都非常可观;还有一些语料库被使用众包的购买方式在未来,除了这款音箱之外,语音互动可能会更多地应用在阿里充电生态环境,车载操作系统,TTS语音转语音(Text to Speech)等场景中。 X1发布后,百度还宣布了一个基于自然语言处理的DuerOS语音系统,与阿里巴巴的语音交互系统Ali Genie竞争。陈丽娟在评论竞争对手时表示:“今天我们的山猫精灵可以拿到它,但是DuerOS买了它,差别不仅在于技术方面,而且我们需要把这个道路通过更多这样的合作伙伴的成功将要和我们一起玩“。更直白的话说,其含义是,尽管李彦宏一直坐在有人驾驶的”无人驾驶车“上在路上,DuerOS仍然有一段时间远离市场上完全可以买到的产品。阿里巴巴智能扬声器是阿里巴巴人工智能实验室首款商用产品,是语音交互功能的集中体现。一开始,阿里不想发言硬件产品,因为硬件产品供应链很长。但是后来这个团队发现一个智能音箱涉及太多的关键领域,阿里放弃了完全的OEM模式,而不是自主研发。整个研发周期跨度一年,最大的困难就是每个环节都是一条线。例如,麦克风阵列需要内部密封,产品的第一个版本密封性不好,ASR(自动语音识别)受到轻微漏气的影响。不准确的ASR进一步影响NLP(自然语言处理)并进一步影响整体情况。是线性增长放大的蝴蝶效应。自2017年以来,阿里巴巴一直在投入人工智能。曾任南洋理工大学全职教授,亚马逊高级首席科学家王刚,曾任iDST副院长。首席科学家等。从组织结构上看,人工智能实验室的阿里分工也更加清晰。 iDST创立于2013年,是AI基础技术研究院及2016年成立的AI实验室的前身,其研究成果源于iDST的技术积累,适用于阿里巴巴所有产品线。在一个大的框架内,实验室分为终端实验室,硬件实验室,代码实验室,而不是完全按照产品线。在人工智能领域是非常重要的计算能力,在不同的实验室中,计算能力分为终端云计算和计算能力。人工智能实验室似乎更倾向于进行底层的技术研究,而阿里巴巴没有太多的硬件传统可以把更多的精力放在大数据驱动的公司上。在解释为什么阿里会做硬件的时候,陈丽娟说:“我们不想留在实验室.AI应该是一个具体的服务,应该给用户一个全新的体验。虽然第一个版本的淘宝购物体验不好,但是与网上购物相比,今天AI还是会给用户一种不同的感觉,应该是技术产品或产品技术,这是一个问题。