• 阿里出来后,他从拓荒者变成了领头羊丨我是创业者 翟鲁峰

    #标签#:新闻资讯2017-05-12 10:35by:赵可
    962

    我是创业者 09 期

    本期创业者:翟鲁峰

    创建:上海问之信息科技有限公司

    他曾负责盛大语音合成团队,他也曾负责阿里语音和图像算法团队;他在人工智能萌芽期开始探索,在大热期开始创业,短短一年半,将语音语义识别做到了极致,不 仅能够提供全解决方案,还打出了语音物联云、高度定制化语义云、基于神经网络芯片的离线识别等一套组合拳,要编织一张疏而不漏的天网,他是问之科技的创始人,翟鲁峰。

     

    阿里人工智能领域的拓荒者

    翟鲁峰曾在阿里无线事业部和智能生活事业部,负责阿里语音和图像算法团队,工作重心是建立语音团队,并将前沿的语音和图像技术应用于阿里和支付宝集团的相关业务。那时候淘宝正在PC到移动转型中,翟鲁峰和他的团队适时推出手机淘宝的“语音搜索”,给多元化的内容聚合提供了一个新的交互入口。而后在天猫魔盒实现语音遥控器功能,也是一直做移动互联网的翟鲁峰的硬件初尝试,为日后团队的硬件基因播下了种子。

    天猫魔盒所实现的功能:长按语音键即可语音搜索,直接查询影视歌曲及购物等。跟随天猫魔盒的云OS系统,语音交互功能也被应用到多个知名品牌的智能电视中,日后这种语音搜索成为电视盒子的一种标配。也是在这个时候,翟鲁峰发现这是一个痛点:硬件产品对语音有很强的需求。之后一段时间,他结合阿里智能业务研究语音图像技术在物联网和机器人上的应用。

    在阿里巴巴的那几年中,他是最早将深度学习落实到阿里产品中的人,拍立淘、天猫魔盒这两个智能产品的核心语音和图像算法,都是由翟鲁峰带队产生。从策划到落地到产品问世,他在阿里巴巴可以说是研究AI的先驱者。

     

    抓住人工智能的尾巴,大干一场

    在阿里的那几年,翟鲁峰一直在人工智能的道路上探索,对人工智能理解的越深入,越发明白这个热潮是无法阻挡的,如果再不抓住这波创业的热潮,可能再也来不及快速成长起来探索新领域。于是他果敢的放弃了阿里高薪稳定的工作,创建了“问之科技”。

    第一步,想清楚商业模式。在撸起袖子干之前,翟鲁峰做了大量的市场调查,拜访了各行业的资深人士,建筑、家居、智能硬件等等,最终他决定放弃图像算法,只做语音,并且将语音细分到两个领域:智能家居、机器人,他认为这两个领域最容易实现弯道超车。

    第二步,快速发展:产品技术一块抓。工 作这么多年翟鲁峰最大的领悟就是:这一行一定要高效,颠覆性的新技术在下一秒可能就会出现,所以一定要加快发展的速度。而高效意味着需要高强度的合作,高 强度则应小范围。他的团队就集中在一个办公空间内,一进门就能感受到一种快节奏的工作氛围,每个人身上的专注都不可控的外泄出来。同时,快速发展也离不开 和平台的合作,互相导流,共赢是现在公认的绝佳方式。

    先行路上坑太多,只能见招拆招

    对翟鲁峰来说,虽然当Leader很多年,但创业却是第一次,角色的转变给他带来了许多的压力和挑战,不过路途坎坷坑很多,他也自有一套应对的办法。

    一:懂得舍弃。最重要的是要想清楚自己到底想要做什么,在做什么和不做什么之间,一定要有明确的抉择,优柔寡断会断送公司的前途,一把抓对于创业公司来说不是一个明智的选择。

    二:适应变化。这是一个不断在变的世界,不管是当下的新技术,还是市场的新需求,一定要根据自身的发展,不断去适应和调整新的变化。

    三:多方合作。不 要把鸡蛋都放在一个篮子里,也不要在一棵树上吊死。你可以遍地开花,但选择几个结果就行。尤其是在产品芯片这一块,不同的芯片有不同的适配性,并不是最好 的芯片就是最合适的,翟鲁峰在尝试不同的芯片后,有选择性的和一些厂商固定合作,更有一些建立了联合开发的关系,为加速发展奠定了坚实的后盾。

    四:调整团队。随 着公司的发展,业务拓展的也更多,以前芯片会交给第三方,有层出不穷的问题出现,翟鲁峰意识到不可控的因素太多会严重影响发展速度,于是特意找到相应的专 业人员招进公司。而后为了增加公司的硬件基因,一些做机器人、智能手表等行业的专业人员纷纷加入进来,整个公司的人员配备愈发合理,步伐也越走越稳。

    问之团队成员

     

    全解决方案+差异化运营,力争走在最前端

    做语音语义识别的公司有很多家,但能像问之科技一样提供全解决方案的寥寥无几。因为在最初,翟鲁峰的打法就和别人不太一样,他会把产品先做出来,将一切都做全面了,再将它放到你的面前,让你自己决定是否使用。

    为解决对话不流畅、准确率低、不够智能等问题,问之自主研发了以下解决方案:

    1. 使用加强版静音检测模块,让机器能及时被唤醒或响应

    2. 通过多模块协作,来支持人机对话时的随意打断

    3. 加入Oneshot唤醒+识别——让交互更流畅

    而针对个性化语音语义的定制,也有自己的解决方法:

    1. 个性语音 -「语音 DNA 」

    提高适配程度、识别的精准度。针对不同的使用场景具备应有的特点:

    ♢ 用户个性化:记忆并适配用户习惯

    ♢ 开发者个性化:一个引擎支持多个开发者模型

    ♢ 场景个性化:提供语义场景指导语音训练,修正语音识别结果

    2. 个性语义 - 针对场景的 Aison 文法

    能够解决机器普遍短时记忆的问题,可以长时记忆用户信息。

    ♢ 支持多轮对话。

    ♢ 主动引导用户提供关键信息,以在用户下达单点模糊指令的情况下,进一步确保任务执行的准确度。

    ♢ 实时增量索引的功能使语义能即建即得。

    同时首款基于语音神经网络(DNN)芯片加速的离线语音识别,让家电控制灵活且更稳定、精准,实现本地端唤醒、云端识别。

    到目前为止,问之科技在语音交互全解决方案创新上处于领先地位,同时他们并没有将目光锁定在目前大热的几类技术上面,而是分出精力专门探索新兴领域,去做一个探索的先锋战士,力争赶在最前端研发新技术,从而形成技术壁垒,发展壮大。