2017年9月7日,思必驰DUI开放平台发布会在北京举行,大会聚集近千名行业嘉宾、专业媒体及优秀的开发者。思必驰CEO高始兴、首席科学家俞凯、VP初敏、VP赵恒艺、联想集团智能设备研发高级总监张德魁、大华股份副总裁梁磊、富士康B次集团软件技术总监向能德、富士康B次集团硬件技术总监谢亮、CSDN董事长蒋涛、助理来也CEO汪冠春、海知智能CEO谢殿侠、声智科技CEO陈孝良等嘉宾现场现身说法。这不仅是一场简单的DUI开发平台发布会,更是一场关于AI生态的行业大会。
思必驰CEO高始兴:打造以AI技术为核心的开放生态
图1 思必驰CEO高始兴
现场高始兴表示,思必驰成立于2007年,2014年剥离教育事业部(现为驰声科技,被网龙收购),全面转型智能硬件物联网,专注才更有力量,现在的思必驰,真正二次创业于2014年。思必驰也与阿里、联想、富士康、大华股份、小米、腾讯等企业建立合作,赋能数千万智能终端设备,在智能车载后装市场的占有率稳居行业第一,在智能家居和玩具领域覆盖了急速扩展。
伴随着人工智能的高速发展,思必驰也在不断调整产业的定位和迭代。2013年9月7日,思必驰发布了国内首款对话平台“思必驰对话工场”,开放底层的ASR、TTS、NLU等SDK接口。2016年,伴随着物联网端的速度更新加快,产品更加个性化,需求更加差异化,思必驰开始探索对话平台的需求和应用之路,并在年底正式立项DUI。2017年9月7日,正式发布。历时4年,思必驰赋能开发者的决心未变。
现在,高始兴也分享了思必驰在AI生态领域布局的几个消息:
1、驰星创投浮出水面
思必驰于2016年正式成立了驰星创投,得到了元禾资本、富士康、清华控股等LP的支持,现旗下拥有2亿元天使基金和10亿元成长基金,专注投资人工智能和智能交互产业早期项目。截止目前,思必驰已成功孵化并投资了车萝卜、慧声、先声教育、AITEK、SIGMOID、爱医声、RT-Thread等企业,进一步拓展AI技术的应用领域。
2、思必驰VP初敏牵头,在北京成立思必驰研发院
近期,原阿里iDST语音团队负责人初敏博士加入思必驰,初敏博士在思必驰将负责两个层面,一是参与思必驰对话技术的研究和工程化工作,二是在北京牵头搭建思必驰北京研发院,并将在一年之内组建从基础研究到应用落地的研发团队。
3、思必驰携手海知、声智,打通AI技能
高始兴表示,思必驰愿意将DUI全链路的每个环节都开放,思必驰也已与海知智能、声智科技建立了合作关系,另外还有诸多友商合作正在沟通中。DUI平台将集合最广泛能力,包括从声学、语音、语言等一系列的综合软硬件一体化技术,从而助力行业伙伴拓展应用人群和应用场景领域,助力开发者更自由的个性化选择,实现多方共赢。
4、上海交大-苏州人工智能研究院揭牌落地
8月27日思必驰-上海交大人工智能研究院揭牌仪式在苏州工业园区举行,研究院正式落户园区,未来思必驰将围绕人工智能关键核心技术进行创新研究,打造人工智能创新品牌和国家智能人机交互产业创新中心。
思必驰VP赵恒艺:DUI平台功能全面解读
图2 思必驰VP赵恒艺
思必驰VP赵恒艺介绍到,DUI,全称为Dialogue User Interface,基于Dialogue为核心,思必驰专注于垂直场景,以任务式对话为核心,兼具闲聊与问答功能,打造人性化交互。作为一个全链路智能对话开放平台,DUI提供的,不仅是基于思必驰智能语音语言技术的对话功能,更包括开发者在定制对话系统时所需要的综合服务,如GUI定制、版本管理、私有云部署等,让开发者可以完全依据需求随心所欲定制对话交互系统。
图3 思必驰DUI平台
DUI开放平台拥有四大系统:
青囊系统,是彰显DUI服务力和研发支撑的系统。用户发现问题、反馈问题,修复Bug、更新版本,一键工单到后台,不仅还原用户问题现场,还直接缩短一个需求从发现到问题分析、迭代、上线的闭环链条,便于平台整个研发体系和流程的打通和管理。
天机系统,具备洞察力的大数据系统。可采集和存储基础语音交互数据,分析用户每个请求日志,进行实时反馈,作为用户画像参照维度,通过数据支撑决策,推进平台落地为用户服务,同时也可为DUI平台提供运营支撑和监控,通过数据驱动带来真正的用户体验提升。
紫微系统,DUI平台对紫微也寄予了连接丰富第三方资源的期望。对话定制需要跟音乐、天气、股票、旅游等外部资源进行对接。针对这些需求对它进行接口标准化的封装,然后快速赋能开发者,这就是紫微的使命。此外,紫微还兼容AVS服务,通过简单的配置就可以无缝对接。
玲珑系统,是DUI平台在终端的解决方案和环境支持,具备精巧、敏捷、轻量等特点;为平台定制内容提供多种终端接入的运行环境,提供安卓、Linux、iOS、RTOS等多种运行环境的支持;高可定制化的配置热更新;融合语音交互和图形化交互,使VUI和GUI无缝融合等。最终将形成完整闭环,展示用户定制成果。
图4 思必驰产品经理现场演示DUI平台的开发与应用
现场,思必驰产品经理孙志伟演示了基于DUI平台的开发与应用效果。开发者通过DUI平台可实现全链路的超高度定制,几乎每个模块均可实现自定义,现该平台已覆盖车载、家居、机器人、故事机、手机助手等多应用场景,对接丰富的第三方内容,内置国内最专业的语音语言技能商店,具备深度数据可视化、个性化自定义、零门槛操作等优点,为物联网、移动互联网和互联网的开发者提供单点技术服务和完整的人机交互方案。推动AI语音技术真正开放。
思必驰首席科学家俞凯:让对话智能流通生长
图5 思必驰联合创始人兼首席科学家俞凯
现场,俞凯教授围绕对话智能、流通、生长三个方面,从技术层面做了分享,他表示,从现在开始,思必驰不单单是在对话智能上做事情,而且要在流通生长方面提供一流的技术。
时代在变革,技术、应用和产业链都在变革,思必驰从未停止技术探索的步伐,取得较大成果,例如在抗噪语音识别领域,VDCNN算法模型在Aurora4上,取得了7.09%的词错误率,相比于世界其他机构目前10%左右的最好结果,有大幅度的明显优势;PSD快速解码使识别搜索速度提升了5到7倍,在不同的模型下,综合的速度提升达到了20倍。在语义理解方面,采用双向的神经网络,加上聚焦机制,也取得了标准错误集当中最高的精度。在对话、状态、跟踪当中,采用一些RPN回归性的多向式网络技术,也取得较大成果。
俞凯教授强调,思必驰一直以来做的都是对话技术。对话不等于语音,对话是以人机交互为核心,包括各个模态,对语义的理解,声音、图像、感知层面直接的编码,以完整系统作为优化目标的一种系统级合成,需要全面的技术创新能力。
伴随着语音交互被广泛的应用,多样化的需求为技术提供方带来极大挑战。就此问题,俞凯教授表示,目前国内提供语音交互技能的公司大体上有两种不同的思路。一是提供封闭的解决方案,所有的东西都包揽优化;二是像思必驰DUI这样的思路,开放,形成一个生态圈,有博弈的过程,但这是一个多赢博弈的过程,在生态圈上大家互相体谅。他表示这样一个多赢博弈、互相给养、共同生长的生态才能够带来更大的价值。
真正打造开放生态圈,实现流通型的对话智能,要求企业必须要有大规模的定制技术的能力。思必驰在语音识别&合成、语义理解及对话、软硬件系统支撑等的技术实力,是DUI平台搭建的有力支撑。
最后,俞凯教授表示,生长对话智能是思必驰在有基础智能创新的能力之下,我们会使所有技术不单单是一个静态的,还会实现更多的生长。例如自适应的技术,声学模型的技术,语义的迁移技术,深度的强化学习等技术的研究与应用。这些优秀的技术都在DUI的底层技术规划中,随着技术逐渐生长,将很快地借由DUI平台助力行业体验。
思必驰携手联想、富士康、浙江大华等,以匠心打造精品
近期,伴随着天猫精灵X1、小米AI音箱小爱同学、联想智能音箱、小米板牙70迈智能后视镜等产品的发布,思必驰也备受行业瞩目,这些产品均内置了思必驰语音交互技术,据高始兴介绍,思必驰已与阿里、腾讯、联想、小米、富士康、浙江大华等企业建立了深度合作关系,更多优质的智能产品也将陆续推出。DUI发布会现场邀请了联想、富士康、浙江大华等企业的嘉宾代表出席,共同探讨语音技术的落地与应用。
联想:珠“联”“必”合,共赢AI
图6 联想集团智能设备研发总监张德魁
联想是国内外知名的硬件品牌商,联想与思必驰在智能硬件的语音交互方面早有合作。联想智能音箱国外版搭载亚马逊Alexa,国内版采用了思必驰麦克风阵列技术;会聊天的智能电视65i3采用思必驰线性四麦一体化方案,实现远场语音交互。此外,联想在更多的智能硬件设备上包括PC、平板等也采用思必驰语音,后续将陆续发布。
联想集团智能设备研发总监张德魁在现场表示,将与思必驰基于DUI平台进行广泛合作并寻求构建联合运营平台,让AI赋能硬件发展,在个人电脑,平板电脑,智能电视,智能音箱等智能设备上,深度优化语音体验,进一步提高用户满意度,加速联想在“以用户为中心”和“设备+云”的转型征途。
思必驰在之前已有的语音领域里核心的基础之上,已经完成更系统化的封装、包装,定制出开放的DUI平台。联想在下一步,希望携手思必驰的DUI平台,能够构建更加个性的,整合性强的,服务于联想更多设备的语音平台。
富士康:AI赋能硬件,思必驰助力富士康转型升级
图7 富士康硬件技术总监谢亮和软件技术总监向能德
富士康作为一个传统的硬件设备厂商,逐渐进行转型升级走向AI。发布会现场,富士康硬件技术总监谢亮和软件技术总监向能德从软硬结合两个方面,讲述了与思必驰在音频智能、交互体验设备产品方面的合作关系。
谢亮表示,富士康作为国内制造业的巨头,也要适应时代的发展变流,融入这场AI语音交互的洪流之中。目前富士康与思必驰正在合作的智能机器人,已经达到了跟美国一线产品同定级的数值。他表示,智能机器人在与人合作时需要具备拟人的能力,而这个能力需要靠DUI平台来实现。
向能德则从DUI是如何赋能富士康产品音频交互体验方面作了介绍。以“晓乐”为例,这是一款带屏幕的机器人,更是一款行走的音箱。未来硬件的智能化,应该是能够拥有集视觉与听觉于一体的立体感知系统。DUI平台为富士康的转型升级提供了强大的技术支持,DUI赋能晓乐,晓乐赋能DUI。
浙江大华:AI时代,视频同语音的完美结合
图8 浙江大华副总裁梁磊
大华是思必驰的深度合作伙伴,此次DUI平台发布会也邀请到了大华副总裁梁磊。
梁磊表示,大华与思必驰合作的第一款育儿机器人—小乐,小乐机器人是首款育儿机器人,核心是围绕母子之间展开。它具有行为互动、语音互动、大华视频的互动,在技能方面具有成长教育、育儿知识、早教、亲子游戏等,同时也做了视频的采集、浓缩、编辑。小乐是一款物联网+互联网的产品,更需要与DUI这样的平台进行合作。
2016年12月,大华乐橙与思必驰再次携手,推出了TC5S人工智能摄像机,采用思必驰语音方案,实现实时的语音互动、家庭助理、监控预警等多项功能,TC5S是一款视频+人工智能摄像机,加载思必驰智能语音互动、语音对讲等功能。
梁磊表示,思必驰团队技术是一流的,再就是对客户要求的响应能力。这也坚定了大华与思必驰的合作。在在人工智能时代,除了有大脑以外,还需要眼睛、耳朵、嘴,需要很好的展现出来。因为,未来大华与思必驰的合作不仅仅局限在家庭场景,更可能会在金融方面有很多深度合作。
开放生态,更具价值
思必驰DUI开放平台秉持着开放的态度,力求打造一个人工智能语音交互生态。在发布会现场,思必驰VP初敏博士、CSDN董事长蒋涛,以及思必驰的生态合作伙伴海知智能CEO谢殿侠、声智科技CEO陈孝良和助理来也CEO汪冠春进行了一场关于人工智能语音生态的圆桌论坛。
图9 DUI发布会现场生态圆桌
关于人工智能开放生态的讨论,五位嘉宾都表示,未来AI的发展一定是开放合作的,人工智能生态链的各个环节都非常复杂,没有哪家公司是可以自己全部解决的,需要行业伙伴一起携手,开放的生态才是最具价值的。
图10 思必驰VP初敏
在语音技术经过几十年的研究和发展后,如今语音市场百花齐放,不少语音公司在细分领域做得非常专业,甚至做到了最好,但是用户的需求是延续的,整个语音生态链的各个环节要全部打通。在圆桌现场,CSDN董事长蒋涛作为嘉宾主持,与众位嘉宾讨论了AI语音交互的技术发展和生态未来。
初敏博士表示“在人工智能,不光是语音交互,这样一个技术本身的难度也已经很高了。在这样的情况下,一家想打造的非常好,也会变得越来越难。所以,这个时候就要更倾向于开放的生态。”
海知智能CEO谢殿侠表示,思必驰DUI开放平台与海知的价值观不谋而合。声智科技CEO陈孝良也认为,DUI开放平台是非常具有开放意识的平台。助理来也CEO汪冠春则表示,思必驰原本的语音技术已经非常出色,DUI开放平台更具价值。参与圆桌论坛的三位生态伙伴都表示,之前与思必驰的合作主要集中在语音交互技术的某一环节,DUI开放平台的推出,之后的合作会上升到一个更高的台阶。
图11 DUI平台正式开放注册启动仪式
竞合共生,打造人工智能语音交互生态,必将是未来的趋势,持续开放的思必驰DUI开放平台将为更多的企业和开发者定制个性化的服务,为智能生活带来更多可能。
语音交互智能时代刚刚到来,在语音技术各环节逐渐完善和丰富的过程中,行业伙伴应该要有胸怀,在生态里面共同发展、共同盈利。良性有序的语音生态发展,将给生态系统中的每一位参与者带来红利,同时也会让语音市场更加蓬勃的发展。
精彩评论