继北京站之后,4月18日,云知声开放日(OpenDay)第2场来到深圳。本次云知声开放日聚焦AI技术、应用和产业,云知声董事长/CTO梁家恩博士与多位云知声技术专家向深圳的合作伙伴、行业人士全面的秀出了全栈AI硬核技术,并与腾讯杰出科学家/腾讯AILab副主任俞栋、携住科技联合创始人叶明、同行者科技联合创始人叶维、金鹰卡通卫视产品总监戴文博、三诺声智联副总经理乔峤等多位嘉宾,剖析了AI技术在酒店、车载、教育等领域的应用及落地。
全栈:技术能力全栈,产业服务全栈
梁家恩博士作为人工智能行业的资深从业者,在现场与我们复盘了发展历程,他表示,在AI大潮退去之后,技术的产业化能力成为了决胜的关键。技术如果不能解决产业问题,那么技术将化为企业“炫技”的产物。基于此,梁家恩博士将云知声的AI哲学概括为“全栈”和“硬核”。
云知声董事长/CTO梁家恩博士
“全栈”包含了全栈AI技术能力和全栈AI落地能力两个维度。经过多年的发展,目前,云知声的AI能力已经超了单一的语音技术,覆盖了Atlas机器学习超算平台,信号、语音、图像、文本的感知和表达能力,知识、理解、分析、决策等认知技术,并朝着多模态人工智能系统方向发展。同时,云知声通过将能力封装在自研AI芯片之上,打磨了“云端芯”一体化产品体系,推动AI技术在家居、车载、儿童、教育、医疗、金融、零售等多个领域实现落地,实现了从AI技术到产业应用的生态闭环。
硬核:确实、有效地解决产业规模化痛点
“硬核”,指技术方案能够确实、有效地解决产业规模化痛点,为终端用户提供相对成熟的用户体验。
以当时热门的智能语音为例,经历了两年的市场教育,现如今,语音交互技术被广泛应用到各大场景中,成为了AI技术落地典型的应用案例。然而,在实际使用中,AI需要面对的情况比实验室中要复杂得多,一旦产品软硬件的某一环处理不好,便容易出现“听不到、听不懂、答非所问”等问题。针对这类行业痛点,在本次云知声开放日深圳站现场,云知声的技术团队从语音交互技术的拾音、识别和交互等维度,深度剖析了技术难点和解决方案。
在AIoT场景下,设备首先要解决的便是远场拾音问题。云知声AILabs技术专家关海欣表示,解决远程语音识别的关键在前端信号处理阶段,解决回声、混响和噪音3大核心问题,以确保设备可以准确识别到用户指令。目前,云知声在回声消除、混响抑制、噪声处理等方向均已有成熟的技术方案,相关技术指标均达行业水准。另外,未来远程语音识别还将呈现DSP+DL结合、分布式拾音两大趋势,对此,云知声也已经展开了相应的技术部署。
云知声AILabs技术专家关海欣
在语音识别阶段,则需要在声学和语言层面,赋予机器感知并语音指令的能力。云知声AILabs技术专家李轶杰表示,声学方面,云知声基于大数据、前沿声学建模、自适应学习搭建了声学模型;在语言层面,云知声创建了一个数据规模大、融合能力强、灵活和个性化的语言模型,以上模型在还将基于超算平台不断优化迭代。此外,云知声还将其语音识别能力延展到语音评测、声纹识别、情绪识别等多个方向。
云知声AILabs技术专家李轶杰
在对话阶段,围绕更加自然的人机交互,云知声打造了流式交互、语用计算与知性会话3大硬核能力。云知声AILabs技术专家单波介绍到,流式交互最大的特点是在多轮对话免唤醒,大大的提升了人机对话过程中的流畅程度;语用计算则是将人机对话内容放置到对应的语境中,让设备准确的理解人的意图;最后,知性会话则是通过将知识图谱应用到人机对话过程中,让设备准确的响应用户的问题。
云知声AILabs技术专家单波
基于上述技术,2013年,云知声面向合作伙伴开放对话技能开放平台(语义云),帮助合作伙伴打造更加自然的人机交互体验,同时在实践中不断提升语义解析能力。目前这一平台已经支持200多个的对话内容,覆盖通讯、休闲娱乐、医疗健康、交通出行、设备控制等多个场景,语义解析准确率高达93%。
值得一提的是,语音感知与表达、语言与知识计算只是云知声硬核AI技术的冰山一角,目前,云知声硬核技术还包含了AIoT芯片、超算平台与图像、翻译拓展等。
落地:覆盖酒店、汽车、儿童、音箱等场景
在大数据、深度学习、超算平台的加持下,人工智能底层技术将冲破阀值,带来成熟的体验,在技术和需求的双重推动下,人工智能将迈入发展的黄金阶段,并掀起新一轮的AIoT产业变革。在下午的「智能+」分论坛中,云知声副总裁康恒、云知声AIOS架构师郭洪光、与携住科技、同行者科技、金鹰卡通、三诺声智联等多位合作伙伴,结合实际案例,深入探讨了AI技术的在酒店、汽车、儿童和音箱等场景中的应用。
云知声副总裁康恒表示,在整个产业链中,AI技术是个“基础设施”,且这一基础设置不可能在不加以定制的情况下适用全部场景。AI在落地过程中,需要充分考虑使用场景和落地行业。基于对场景和产业的深度思考,2014年,云知声便开始结合产业链,将云知声的AI技术赋能到个行业中去。
云知声副总裁康恒
面向行业,云知声推出了一站式人工智能平台UniOS。云知声AIOS架构师郭洪光表示,与同类产品相比,UniOS具备开放、垂直两大特性,其中,开放指的是云知声面向行业和合作伙伴开放技能平台和设备平台,并在此基础上兼容第三方AIOS;垂直则代表UniOS会针对特定的行业需求输出解决方案,以此来帮助产业转型。
云知声AIOS架构师郭洪光
携住科技联合创始人叶明跟我们介绍了AI技术在酒店场景中的应用案例。叶明表示,针对酒店场景,携住科技基于AIoT技术,通过多种设备联动、场景定制,为酒店客户带来全新智能互联的场景体验;另一方面,通过信息整合和大数据分析,AI还将提高酒店管理效率。
携住科技联合创始人叶明
同行者科技联合创始人叶维分享了AI语音技术如何助力汽车产业升级。叶维表示,在车载场景下,语音即为服务——语音是用户与设备、与互联网连接的主要手段,承载了车联网资源整合与用户触达的功能。因此,车载场景下的AI必须聚合丰富的内容和服务,并根据场景进行智能匹配,打造千人千面的智能化体验。
同行者科技联合创始人叶维
金鹰卡通卫视产品总监戴文博分享了金鹰卡通对儿童产品智能化的思考。戴文博指出,儿童和家长对智能产品的需求与普通场景十分不同,基于此,金鹰卡通围绕儿童场景的特征,将AI技术与“麦咭”的形象做了深度整合,打造麦咭智能亲子智能产品生态。
金鹰卡通卫视产品总监戴文博
三诺声智联副总经理乔峤从产品角度出发,与我们分享了人工智能产品设计思考。乔峤指出,人工智能时代的设计方向是感知设计,产品只有将形状、外观、听觉、触感等诸多因素综合成一个完整的信息,充分调动人类的本能,才有可能设计出更普遍更通用的产品。
三诺声智联副总经理乔峤
以带屏音箱为例,屏幕为人机交互补充重要的视觉信息,更加接近用户本能,“未来5年,单带屏的智能音箱就会达到3亿多台,超过PC的规模。”
关于云知声OpenDay
OpenDay是云知声一年一度的对外进行技术分享与交流的活动,是云知声面向人工智能硬核科技,与合作伙伴、相关学术和产业研究机构等共话人工智能前沿技术与产业应用并探讨合作的平台。2019首届云知声OpenDay设北京、深圳、上海、厦门四站。继北京、深圳站之后,上海站活动将于5月上旬正式开启。
关于云知声
云知声成立于2012年,是一家专注于物联网人工智能,拥有自主知识产权的智能语音人工智能企业。是中国人工智能行业成长快、商业化落地最好人工智能企业之一。云知声业务主要覆盖智慧生活和智慧服务两大场景,在包括家居、车载、医疗、教育、政府、机器人等领域拥有广泛布局。客户涵盖格力、美的、长虹、海尔、华帝、北京协和医院、吉利、平安集团、京东、360等。
2018年5月份,云知声正式推出第一代UniOne物联网AI芯片及其解决方案——雨燕(Swift)。该芯片由云知声自主设计研发,采用云知声自主AI指令集,性能较通用方案提升超过50倍。基于该芯片的标准化解决方案,可帮助传统硬件产品在更短的时间周期内,以更少的成本快速实现AI化,实现人机交互智能。
精彩评论