本文共 3876 字,大约阅读时间需要 12 分钟。
提到端 AI,大家一定会想到手机上的键盘。输入法已成为移动端 AI 最为成熟,也最为有成效的应用之一。在这一领域,触宝是最早的先行者之一。
截至目前,触宝输入法已拥有超过三亿月活用户,覆盖 200 多个国家和地区以及 250 多种语言。这些成果,就是基于触宝 AI 实验的语言模型研究成果。在触宝的产品线中,AI 的应用可以实现哪些功能?通过本文对触宝 AI 实验室高级技术总监吴琨的采访,我们来了解一下触宝的 AI 落地实践,它能引发业界关于移动端 AI 的哪些思考和想象?
据触宝AI实验室高级技术总监介绍,触宝AI实验室目前有20位成员构成,主要研究方向为自然语言理解、语言模型、语音识别和深度学习和通用机器学习的应用。触宝输入法目前拥有超过三亿月活用户,覆盖200多个国家和地区以及250多种语言,就是基于AI实验的语言模型研究成果。同时,目前触宝输入法已经实现了自主研发的语音识别来替代第三方解决方案,为国际用户提供语音输入支持。在机器学习方面,触宝AI实验室和加州大学伯克利分校合作建模研究营销电话的鉴别。同时,在触宝内部多个App中也落地了包括推荐系统、点击率预测等项目。
触宝移动端的AI由深度学习语言模型为核心,配以NGRAM模型做辅助,同时也加入了很多多年积累的专家规则,可以说,这个架构包含了NLP历史发展的三个阶段的经典经验:规则、统计、神经网络。这样可以进行优势互补,达到体验最优:规则可以覆盖很少一部分重要的体验,同时计算代价低,而神经网络可以用较高计算代价获得最好的预测性能,最后NGRAM则是一种投入产出的折中。
吴琨介绍道,触宝移动端最初的AI应用是输入法内核,在终端进行语言模型的计算。
之后,第一次迭代是发生在2012-2014年,触宝开始构建自己的大数据计算平台,产生了骚扰电话号码识别等应用。
第二次迭代是在2015-2017年,触宝构建自己的广告变现平台和推荐系统,开始内容生态建设和商业化变现。
第三次迭代是2017年之后,触宝将所有的数据打通,统一处理,构建用户管理平台,对多产品、全用户生命周期的数据进行分析建模,来降低运营成本,提高变现效率。在产品方面则构建了更为成熟的内容分发系统,对多个垂直品类的APP进行用户内容个性化支持。
首先是关于深度学习框架的选用,触宝选用的是谷歌的Tensorflow框架,包括终端计算也是Tensorflow Lite,主要原因是触宝和谷歌保持多年良好的合作关系,通常能够有渠道一起反馈和改进技术上的问题,也能够及时体验和应用谷歌新的技术。例如,针对Tensorflow Lite在移动端的应用,触宝就和Google在其中文社区中进行了文章分享。同时触宝也认为在移动端,谷歌的计算框架还是有发展优势和前景的。
事实上,将AI应用于输入法中已经不是一个新鲜的做法了,很多输入法中都采用了最先进的AI技术,如讯飞输入法、百度输入法等。那么,在触宝输入法中,AI的应用有何特别之处呢?
首先是语言模型的AI化,触宝使用深度学习进行模型训练。其次是在数据处理的过程中运用AI技术来进行语料处理,例如语言检测、实体识别、新词发现和脏词过滤等。触宝根据不同类型的反馈来不断改进系统,这些反馈包括包括用户行为、用户评论、语料更新等。
在触宝的内容产品中,AI技术也得到了落地。吴琨表示,触宝的产品研发全线都有AI技术参与。在所谓海盗指标AARRR(获客、激活、留存、营收、推荐)的全过程,触宝都使用大数据和机器学习对产品和用户进行建模,来指导生产、营销、推广等过程。其效果比较理想,使得触宝的营收增长和毛利都在行业中处于领先位置,这个从我们的财报中就可以看出。
触宝2018年Q4财报显示,受惠于内容系列产品的显著增长,触宝四季度净收入同比增长147%达4705万美元,2018全年净收入同比增长259%至1.34亿美元;四季度及全年的净利润分别为408万美元及1039万美元,去年同期净亏损则分别为225万美元和2366万美元;四季度及全年经调整的净利润分别为489万美元和1275万美元。
触宝创始人兼董事长张瞰表示:“我们对公司在2018年第四季度的业务进展感到振奋。2018年我们实现了重要的里程碑目标。内容系列产品的DAU快速增长,证明了公司致力于成为人工智能驱动的全球内容分发平台的战略是成功的。”
据媒体报道,触宝的智能助手Talia只面向印度市场,但据吴琨介绍,Talia并不仅服务于印度市场。Talia通过触宝的厂商合作伙伴,率先搭载在向印度地区发货的智能手机里,而在在线渠道,Talia已经支持了几十个国家和地区。触宝一直极为重视国内市场,不过目前Talia的各项功能需要和供应商对接,所以在业务层面,支持国内市场还需要一个过程。
据悉,Talia具有情景感知、沉浸式体验和 AI 主动推荐三个卖点,这三个功能的具体实现技术是怎样的呢?
Talia的核心技术与自然语言理解相关。首先是需要对用户的输入进行意图识别和实体识别,然后再将输入结构化,派发给相关的后端服务,通过后端计算后返回结构化结果呈现给用户。但难点在于用户并不直接和机器人交互,而需要Talia在用户自然输入过程中理解用户意图,所以对模型分类准确率要求较高。同时,这也需要研发人员针对不同场景进行服务范围的归类和压缩,间接从产品设计上提升识别准确率。
从最早的触宝输入法开始,触宝一直以来都在AI的第一线进行实践和探索。目前从短期来说,触宝将优先落地对业务目标有帮助的AI项目,例如对用户生命周期的预测和分析、用户行为的建模预测、输入法全语言的AI化以及将AI能力在B端进行输出等。
长期来说,触宝将在AI方面持续投入,因为触宝看好AI这个科技领域的长期发展,触宝的AI重心仍然将在自然语言领域,将会结合自己的产品、数据,加大对包括语音、语义等方面的基础研究,并将其成果应用到产品和服务中去。
相信拥有一台真正可以依赖、可以帮助我们处理日常任务的智能终端设备是每一个人的梦想,这也是很多企业的产品目标。那么在吴琨看来,在未来,智能终端设备会是什么样的?出现哪些发展趋势呢?
在吴琨看来,智能终端设备可以分为这么几类,第一类是IoT(物联网)设备,这些设备的特点是可以连入小范围的局域网,然后通过某个中央枢纽节点路由到广域网。IoT的设备只需要完成一些简单交互和功能,所以终端运算能力、存储能力和智能程度比较低,交互方式应该以简单语音指令为主。
第二类是特定领域的智能设备,如服务机器人、智能音箱等。这类设备一般都有触屏,所以需要有更为复杂的交互,除了语音识别外,还需要对话管理、语义理解、图像识别方面的技术应用。所以,对软硬件的要求也会比较高,需要终端有较强的运算能力。
第三类是平台化的智能服务加上具有中等运算能力的终端设备。例如将大型游戏的运算从终端转移到云端,然后将数据传回终端。这类终端也需要承担部分运算以便弥补网络设施带来的延迟,但相对来说,会比IoT要更为强大。
真正的人机交互的话题更多的是哲学层面的。如果要实现人和人一样的人机交互,那么看起来通用人工智能是必不可少的前提。
目前学术界有诸多观点,吴琨比较看好的是三个条件:第一是比目前数据量更大、全且完整的海量无结构数据;第二是比目前计算能力强得多的计算机;第三是比目前网络结构更为复杂但通用的更趋近于人脑的神经网络。然后我们就可以尝试去让计算机从数据中自己发现知识、学习知识。不过,目前这些条件都不满足。因此,我们还是应该脚踏实地,从具体业务、需求出发,走出一条AI实践、AI落地的路,从许许多多这样的路中,总结归纳出更好的方法论,为实现远期目标做有效积累。
近年来,机器学习特别是深度学习的模型推演,逐渐出现了从云端向终端迁移的趋势。但终端机器学习取代云端机器学习会成为未来的趋势吗?
吴琨认为,出现这一现象主要有这几个原因:首先是终端硬件计算能力的提升,特别是专门用于神经网络计算的AI芯片逐渐成为中高端设备的标配。第二是行业对数据保护和用户隐私的重视,使得非必要数据可以不必通过上传到服务器就能服务用户。第三是终端计算可以规避网络延迟和无网弱网情况,使得服务的体验更好。第四是科技的发展使得AI工程技术人员能够更有效的利用数据来达到同样的服务效果,使得终端计算的可行性也进一步提高。
但吴琨认为,尽管如此,终端机器学习未必会取代云端计算成为主流。因为两者的场景和特点不尽相同。在对数据规模大、模型复杂,同时对模型效果要求高的场景,还是需要云端来支持。所以应该会出现计算资源划分更合理,云端计算和终端计算各得其所的局面。
采访嘉宾介绍:
吴琨:CooTek AI Lab Senior Director
2010年加入触宝(CooTek),现任触宝AI实验室高级技术总监,具有超过9年移动互联网出海经验,参与落地多款针对移动终端用户的人工智能、机器学习、自然语言相关产品,涉及语言模型、用户画像、推荐系统、文本生成等技术领域。
吴琨老师将在7月深圳上分享更多输入法技术细节。此外,会上还将涵盖腾讯机器翻译技术、Google AI产品研发、阿里对话机器人构建、支付宝舆情监控智能化等话题,干货满满。
转载地址:http://lpjyx.baihongyu.com/