深耕语音输入12载:讯飞输入法走向万物智能新世界

作者:Alter

科目二考试不慎挂科后,我爸在微信上向我抱怨道:

“整天都在说人工智能,可人工智能到底在哪里呢,为什么到了2022年,自动倒车入库的功能都没普及,导致科目二考试还是那么难。”除了文字上的抱怨,还特意加了张某自动驾驶企业的宣传图。

我没有正面回答我爸的疑问,而是问了他另外一个问题:“你连拼音都打不好,为什么能给我发这么长的一段文字?”大约过了一分钟后,我爸回复了这样一段话:“我用的是讯飞输入法的语音输入,直接对着手机说话就能生成字。”

可能在很多人的认知里,人工智能的价值在于颠覆性的改变,而选择性忽略了生活中那些潜移默化的影响。

就像语音输入的例子,我爸夹杂着普通话与河南方言的输入习惯,五年前还是难以想象的场景,那时候语音输入的准确率已经达到95%以上,但方言的识别准确率让人难以直视,普通话和方言混合输入的话,可能会直接让系统“宕机”,如今语音输入已经成为许多人最常用的输入方式。

同样被忽略的是,在语音输入这件“小事”上,讯飞输入法已经走了12年,创造了一个又一个里程碑。

01 被“语音”解放的长辈们

大约从五年前开始,“下沉市场”逐步成为外界讨论的焦点,不但延长了人口红利消失的时间周期,也为互联网巨头们找到了新的流量来源,甚至是说在某种程度上左右了当下的互联网商业格局。

有人将其归功于“华米OV”,因为智能手机价格的下降和渠道的密集覆盖,加速了智能手机在下沉市场的渗透;也有人认为是微信、拼多多、抖音等杀手级应用的功劳,以一种特殊的魔力唤醒了“五环外人群”的参与感。

应该被铭记的还有语音输入。

如果说拼音输入法是打开中文互联网的钥匙,一度是PC时代最普及、调用频次最高的产品;语音输入就是移动互联网走向下沉市场的捷径,原本被隔离在互联网围墙外的中老年人,正是靠“语音输入”的流行,才打破了他们与互联网之间的藩篱,所扮演的角色不亚于智能手机的普及。

故事听起来并不复杂,可想让“语音输入”被普通话都说不利索的中老年人用起来,并不是一件容易的事。就拿讯飞输入法来说,为了提升语音输入的效率和普适性,在技术上下了很大一番功夫。

比如讯飞输入法12.0版本中推出的语种可控方言免切换系统,无须手动调整语音识别模式是普通话还是方言,就能实现普通话和23种方言的自由说。像我爸这类普通话中有着明显的河南口音,时不时说几个方言词汇的用户,语音输入时不需要人为切换输入方式,极大地提升了用户体验。

再比如讯飞输入法对离线方言语音输入和复杂环境语音识别的优化,不仅解决了高噪、远场混响等环境下的识别准确率,即使是在离线的情况下,也能使用方言进行语音输入。语音输入不再是一种新奇的体验,而是满足用户全场景需求的通用输入方式,正在无形中重构人机交互的底层逻辑。

把视角再放大一些的话,随着语音输入效率的升维,被讯飞输入法“征服”的绝不只有中老年人。驱动输入法进化的源动力,始于“效率”二字,不管是拼音对五笔的替代,还是九宫格、手写等输入方式的流行,都离不开效率的提升。进一步解放生产力的语音输入,自然是所有群体都无法拒绝的选项。

可以佐证的是,讯飞输入法的用户画像中,包含了Z世代游戏人群、效率人群、银发人群以及视障人群,他们的需求各有不同,或是青睐于游戏语音键盘、或是钟情跨屏输入模式、或是看到了长辈模式和无障碍模式的贴心……在语音输入赛道上长跑了12年的讯飞输入法,早已成为“个性多元需求”的代名词。

02 万物智能的输入逻辑

当互联网的用户规模逐渐饱和,万物智能被证实是下一个十年的核心命题,输入法也需要与时俱进:所需要解决的不单单是人与人之间的沟通,还要为人与物的“对话”给出效率更高的解决方案。

在讨论这个话题前,似乎有必要回答一个出现频次很高的问题,即在万物智能的秩序和规则里,输入法是否属于刚需产品?毕竟语音识别并不是输入法的专属,而作为“第三方”产品的输入法,需要在万物智能中找到自己的生态位。

这也是讯飞输入法想要回答的拷问。刚刚结束的2022科大讯飞全球1024开发者节上,科大讯飞的输入法总经理程坤在演讲中多次提到“万物皆智能”的理念,并给出了讯飞输入法的应对之策。

首先是创新能力的输出。正如前面提到的,讯飞输入法针对语种免切换、离线方言、复杂场景下的语音识别等进行了深度优化,同样的能力也适用于复杂多变的人机交互,用于解决人与机器之间的感知和表达难题。

一个直接的例子,当前用户的智能产品列表中,已经出现了智能汽车、智能家居、穿戴式设备等不同产品,想要满足不同场景下的人机交互需求,考验的不只是语音识别的准确率,还有经过用户实际使用验证的差异化方案。而有着亿万活跃用户的讯飞输入法,已经为手表等小屏设备提供流畅的手写、面向折叠屏设计了“分裂键盘”、更大显示的智慧屏提供跨端流转的输入等等,可以说是离用户和真实场景最近的玩家。

其次是内容表达的满足。在用户和智能化产品的交互中,“语音输入”本质上只是入口,深层次的需求在于内容表达,通过语音输入连接各种各样的服务,譬如网购、社交、外卖等消费和生活的场景需求。

记忆中,讯飞输入法在11.0版本中推出了“AI助手”,仅仅1年时间,这个平时不起眼的小助手已经拥有22种AI功能,覆盖聊天、发布、搜索、评论、评价、个性表达等场景;并在讯飞输入法12.0版本中,进一步搭载了全新AI智能化输入引擎,在聊天、音乐、综艺、影视、生活服务等场景下,都能赋以高效和准确。简单来说,讯飞输入法的切入口是输入服务与用户连接的需求,也是智能化时代用户交互的根基。

至于讯飞输入法的路线是否正确,现阶段还无法给出确切的答案。不妨来重温一个屡试不爽的产品逻辑:更低的使用门槛,更直接的交互方式,是一切产品发展的方向,万物智能时代也不例外。

再确切一些的话,包括讯飞在内的第三方输入法,正在不断向金融、教育、司法、医疗、车载等场景渗透,输出定制化的解决方案,为用户带来更好体验的同时,也为自身找到了新的增长空间。

03 输入法的生态化破局

从最早的语音输入到赋能万物智能,输入法作为人工智能技术的天然载体,不可或缺性已经毋庸置疑,却仍要面临商业化的挑战:在工具型产品整体式微的局面下,输入法的想象空间到底在哪?

回到文初的例子,像我爸这样的用户不在少数,他们是语音输入的直接受益者,以润物细无声的方式深切改变了他们的体验感,一旦养成了语音输入的用户习惯,就是讯飞输入法的护城河。可不同于智能驾驶等技术的话题性,语音输入的大众化普及,反倒制约了讲述资本故事时的吸引力。

为了改变传统的市场认知,讯飞输入法代表的输入法头部玩家进行了多种尝试。典型的例子就有To B探索,面向不同的行业打造场景化的输入解决方案,降低用户在垂直场景里的输入门槛;同时还有增值服务的尝试,利用个性化皮肤、字体、表情包等吸引用户付费,事实上,好的产品和有价值的服务,用户是乐于付费的。

在讯飞输入法12.0的发布现场,面对输入法在万物智能时代遇到的新考题,讯飞输入法产品总监赵明路给出了生态化的破局思路。

相对应的就是“i-Blocks”输入个性化内容开放平台,旨在搭建开放内容与服务的载体,以生态开放的理念,将创作者、IP方、设计师、普通用户串联在一起,形成生产、消费、价值创造的生态闭环。

个中逻辑并不难解释。

进入到万物智能时代后,人机交互势必会出现复杂多样的一幕,不同的产品有着不同的交互界面,不同的场景有着不同的输入偏好,不同的用户群体有着不同的需求,想要解决新的输入问题,既需要产品功能的持续创新,也需要内容生态的不断壮大,“i-Blocks”输入个性化内容开放平台担纲的正是内容生态的建设。

以当前最为热门的智能车机为例,首先要解决的是输入效率,然后是个性化的满足。比如定制化的皮肤提升品牌的用户认知;再比如车机、手机、电脑的多端联动,需要表情包、字体等元素进行表达……当输入法的连接对象由过去的用户和服务,衍生到终端客户、品牌方、创作者、用户差异化需求等更多层面,内容生态将是输入法承接客户诉求、满足用户需求的重要支撑。

找到的最新一组数据是:目前讯飞输入法个性化内容服务使用者中年轻用户占比达48%,吸引了内容创作者过万人,内容使用量多达100亿次。而在万物智能时代,内容使用需求注定会爆炸性增长。

做一个总结的话,讯飞输入法的优先级、竞争壁垒和技术优势,决定了其行业地位短期内不会被挑战,进一步拓宽语音输入场景,并在内容生态上不断积蓄力量,不失为一种正确且有前瞻性的打法。

04 写在最后

按照官方公布的数据:目前讯飞输入法的日活用户已突破1亿,语音渗透率达到75%,日语音调用量较2021年提升45%。

不难给出合理的解释,语音为主、键盘触摸为辅、肢体语言动作为补充的混合交互,满足了万物智能时代的基本特征,既是讯飞输入法语音调用量逐年增长的诱因,也是其走向万物智能新世界的战略基石。

在语音赛道深耕十二载的讯飞输入法,正在让越来越多用户摆脱人机交互的种种烦恼,改变不同代际用户群体的交互习惯,沿循着“效率为王”的初心和恒心,赋以输入生态新势能、新方向、新动能。

原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/91386

(0)
上一篇 2022年11月22日
下一篇 2022年11月22日

相关推荐

  • 老百姓大药房,董事长被立案调查,为何股价上蹿下跳?

    来源 / 节点财经 文 / 三生  一只股票,7个交易日6个涨停板,就在股民热血沸腾时,紧接着掉头又是4个跌停板,直接把追高的股民挂到了山顶上。这样暴涨暴跌的股票,在大A有个统一的称呼:“妖股”。 今天说到的这只“妖…

    专栏 1天前
    25.7K
  • 支付宝“碰一下”,创新的不止支付方式

    大型“碰一下”现场!支付宝悄悄创新,移动交互方式next level!商家、消费者“碰”然心动!“碰一下”,碰出数字化新篇章。  作者/番茄酱  出品/新摘商业评论  更开放,更前沿,更创新:9月7日,被海外科技媒体评为“2024…

    专栏 1天前
    25.0K
  • “冰山之下”:谁在成为车企的真正智能助手?

    “其实我们一直扮演的角色就是数字化助手,也就是别人可以去挖金,我们给大家提供铲子,这是我们扮演的角色,而现在我们希望给大家提供最好的铲子。”  作者| 皮爷  出品|产业家  如果说AI发展的最鲜明印痕是什么?有…

    专栏 1天前
    26.4K
  • 雷军、余承东、赵明相爱相杀,却难得有一个共同点

    作者:龚进辉 最近,荣耀CEO赵明在2024德国柏林消费电子展上,谈及未来是否会直播带货时,坦言自己是个挺内向的人,在镜头面前有压力,做直播的人太多,不差自己一个。 当有人说余承东也自称很内向时,赵明笑着回应…

    专栏 1天前
    25.9K
  • 企业如何“向内求”, 挖出更多净利润?

    未来的财务部门将是一个“主导“部门,成为业务的翻译官,成为业财融合的引领者,引领企业走在最适合自己的财务数智化转型道路上。  作者|思杭  出品|产业家  收入增速放缓、营收下滑、消费意愿降低,这些也许是近半…

    专栏 2天前
    32.2K
  • 帆软,再攀「一座山」

    能够清晰可见的是,基于Fine ONE,中国企业将可以构建出较真实、较具成长性、较不“内卷”的智能BI体系,同时,在这个天然和数据资产挂钩的体系加持下,企业也将积淀出有足够价值的数据资产。  作者| 斗斗 皮爷  出品…

    专栏 2天前
    31.2K
  • 疑似陷入“崇祯死弯”,光正眼科能否等来“V字反弹”?

    文 | 螳螂观察 作者 | 青月 2024年上半年,民营眼科医疗行业的分化进一步加剧。 审视A股市场五家主要民营眼科上市公司的“中期成绩单”,综合实力最强的爱尔眼科,在上半年取得了营收利润的双向增长,持续领跑;华厦…

    专栏 2天前
    34.8K
  • 淘宝挖来的李诞,在小红书找到舒适区

    来源 | 伯虎财经(bohuFN)  作者 | 宁成缺  自脱口秀界跨界至直播后,李诞意外地成为小红书“直播一哥”,他的直播间在买手榜上经常断崖式第一。  近期一次直播中,他邀请了徐志胜、呼兰等脱口秀同行参与,吸引了接…

    专栏 2天前
    30.8K
  • 图书馆上新了!新华书店×度小满推出“开学季悦读计划”公益活动

    2024年9月,新学期伊始,度小满携手新华书店启动“开学季悦读计划”公益行动。本次活动以“开学季,图书馆上新书”为主题,向度小满“小满助力计划”公益项目落地过的五个地区共六所小学和初中捐赠3300余本图书,让孩子们…

    专栏 2天前
    30.6K
  • 苹果的“AI茅”之路只走了一半

    今年苹果发布会最大的亮点,也许是和华为“撞档”,又或者是替腾讯“发布”新手游,但肯定不是iPhone 16。 9月10日,苹果秋季新品发布会与华为见非凡品牌盛典相继举行,iPhone 16系列也与HUAWEI Mate XT同日发布。 不过…

    专栏 2天前
    31.3K

发表回复

登录后才能评论
联系我们
联系我们
分享本页
返回顶部