當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

深耕語音輸入12載:訊飛輸入法走向萬物智能新世界

 2022-11-22 16:25  來源: A5專欄   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

科目二考試不慎掛科后,我爸在微信上向我抱怨道:

“整天都在說人工智能,可人工智能到底在哪里呢,為什么到了2022年,自動(dòng)倒車入庫(kù)的功能都沒普及,導(dǎo)致科目二考試還是那么難。”除了文字上的抱怨,還特意加了張某自動(dòng)駕駛企業(yè)的宣傳圖。

我沒有正面回答我爸的疑問,而是問了他另外一個(gè)問題:“你連拼音都打不好,為什么能給我發(fā)這么長(zhǎng)的一段文字?”大約過了一分鐘后,我爸回復(fù)了這樣一段話:“我用的是訊飛輸入法的語音輸入,直接對(duì)著手機(jī)說話就能生成字。”

可能在很多人的認(rèn)知里,人工智能的價(jià)值在于顛覆性的改變,而選擇性忽略了生活中那些潛移默化的影響。

就像語音輸入的例子,我爸夾雜著普通話與河南方言的輸入習(xí)慣,五年前還是難以想象的場(chǎng)景,那時(shí)候語音輸入的準(zhǔn)確率已經(jīng)達(dá)到95%以上,但方言的識(shí)別準(zhǔn)確率讓人難以直視,普通話和方言混合輸入的話,可能會(huì)直接讓系統(tǒng)“宕機(jī)”,如今語音輸入已經(jīng)成為許多人最常用的輸入方式。

同樣被忽略的是,在語音輸入這件“小事”上,訊飛輸入法已經(jīng)走了12年,創(chuàng)造了一個(gè)又一個(gè)里程碑。

01 被“語音”解放的長(zhǎng)輩們

大約從五年前開始,“下沉市場(chǎng)”逐步成為外界討論的焦點(diǎn),不但延長(zhǎng)了人口紅利消失的時(shí)間周期,也為互聯(lián)網(wǎng)巨頭們找到了新的流量來源,甚至是說在某種程度上左右了當(dāng)下的互聯(lián)網(wǎng)商業(yè)格局。

有人將其歸功于“華米OV”,因?yàn)橹悄苁謾C(jī)價(jià)格的下降和渠道的密集覆蓋,加速了智能手機(jī)在下沉市場(chǎng)的滲透;也有人認(rèn)為是微信、拼多多、抖音等殺手級(jí)應(yīng)用的功勞,以一種特殊的魔力喚醒了“五環(huán)外人群”的參與感。

應(yīng)該被銘記的還有語音輸入。

如果說拼音輸入法是打開中文互聯(lián)網(wǎng)的鑰匙,一度是PC時(shí)代最普及、調(diào)用頻次最高的產(chǎn)品;語音輸入就是移動(dòng)互聯(lián)網(wǎng)走向下沉市場(chǎng)的捷徑,原本被隔離在互聯(lián)網(wǎng)圍墻外的中老年人,正是靠“語音輸入”的流行,才打破了他們與互聯(lián)網(wǎng)之間的藩籬,所扮演的角色不亞于智能手機(jī)的普及。

故事聽起來并不復(fù)雜,可想讓“語音輸入”被普通話都說不利索的中老年人用起來,并不是一件容易的事。就拿訊飛輸入法來說,為了提升語音輸入的效率和普適性,在技術(shù)上下了很大一番功夫。

比如訊飛輸入法12.0版本中推出的語種可控方言免切換系統(tǒng),無須手動(dòng)調(diào)整語音識(shí)別模式是普通話還是方言,就能實(shí)現(xiàn)普通話和23種方言的自由說。像我爸這類普通話中有著明顯的河南口音,時(shí)不時(shí)說幾個(gè)方言詞匯的用戶,語音輸入時(shí)不需要人為切換輸入方式,極大地提升了用戶體驗(yàn)。

再比如訊飛輸入法對(duì)離線方言語音輸入和復(fù)雜環(huán)境語音識(shí)別的優(yōu)化,不僅解決了高噪、遠(yuǎn)場(chǎng)混響等環(huán)境下的識(shí)別準(zhǔn)確率,即使是在離線的情況下,也能使用方言進(jìn)行語音輸入。語音輸入不再是一種新奇的體驗(yàn),而是滿足用戶全場(chǎng)景需求的通用輸入方式,正在無形中重構(gòu)人機(jī)交互的底層邏輯。

把視角再放大一些的話,隨著語音輸入效率的升維,被訊飛輸入法“征服”的絕不只有中老年人。驅(qū)動(dòng)輸入法進(jìn)化的源動(dòng)力,始于“效率”二字,不管是拼音對(duì)五筆的替代,還是九宮格、手寫等輸入方式的流行,都離不開效率的提升。進(jìn)一步解放生產(chǎn)力的語音輸入,自然是所有群體都無法拒絕的選項(xiàng)。

可以佐證的是,訊飛輸入法的用戶畫像中,包含了Z世代游戲人群、效率人群、銀發(fā)人群以及視障人群,他們的需求各有不同,或是青睞于游戲語音鍵盤、或是鐘情跨屏輸入模式、或是看到了長(zhǎng)輩模式和無障礙模式的貼心……在語音輸入賽道上長(zhǎng)跑了12年的訊飛輸入法,早已成為“個(gè)性多元需求”的代名詞。

02 萬物智能的輸入邏輯

當(dāng)互聯(lián)網(wǎng)的用戶規(guī)模逐漸飽和,萬物智能被證實(shí)是下一個(gè)十年的核心命題,輸入法也需要與時(shí)俱進(jìn):所需要解決的不單單是人與人之間的溝通,還要為人與物的“對(duì)話”給出效率更高的解決方案。

在討論這個(gè)話題前,似乎有必要回答一個(gè)出現(xiàn)頻次很高的問題,即在萬物智能的秩序和規(guī)則里,輸入法是否屬于剛需產(chǎn)品?畢竟語音識(shí)別并不是輸入法的專屬,而作為“第三方”產(chǎn)品的輸入法,需要在萬物智能中找到自己的生態(tài)位。

這也是訊飛輸入法想要回答的拷問。剛剛結(jié)束的2022科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛的輸入法總經(jīng)理程坤在演講中多次提到“萬物皆智能”的理念,并給出了訊飛輸入法的應(yīng)對(duì)之策。

首先是創(chuàng)新能力的輸出。正如前面提到的,訊飛輸入法針對(duì)語種免切換、離線方言、復(fù)雜場(chǎng)景下的語音識(shí)別等進(jìn)行了深度優(yōu)化,同樣的能力也適用于復(fù)雜多變的人機(jī)交互,用于解決人與機(jī)器之間的感知和表達(dá)難題。

一個(gè)直接的例子,當(dāng)前用戶的智能產(chǎn)品列表中,已經(jīng)出現(xiàn)了智能汽車、智能家居、穿戴式設(shè)備等不同產(chǎn)品,想要滿足不同場(chǎng)景下的人機(jī)交互需求,考驗(yàn)的不只是語音識(shí)別的準(zhǔn)確率,還有經(jīng)過用戶實(shí)際使用驗(yàn)證的差異化方案。而有著億萬活躍用戶的訊飛輸入法,已經(jīng)為手表等小屏設(shè)備提供流暢的手寫、面向折疊屏設(shè)計(jì)了“分裂鍵盤”、更大顯示的智慧屏提供跨端流轉(zhuǎn)的輸入等等,可以說是離用戶和真實(shí)場(chǎng)景最近的玩家。

其次是內(nèi)容表達(dá)的滿足。在用戶和智能化產(chǎn)品的交互中,“語音輸入”本質(zhì)上只是入口,深層次的需求在于內(nèi)容表達(dá),通過語音輸入連接各種各樣的服務(wù),譬如網(wǎng)購(gòu)、社交、外賣等消費(fèi)和生活的場(chǎng)景需求。

記憶中,訊飛輸入法在11.0版本中推出了“AI助手”,僅僅1年時(shí)間,這個(gè)平時(shí)不起眼的小助手已經(jīng)擁有22種AI功能,覆蓋聊天、發(fā)布、搜索、評(píng)論、評(píng)價(jià)、個(gè)性表達(dá)等場(chǎng)景;并在訊飛輸入法12.0版本中,進(jìn)一步搭載了全新AI智能化輸入引擎,在聊天、音樂、綜藝、影視、生活服務(wù)等場(chǎng)景下,都能賦以高效和準(zhǔn)確。簡(jiǎn)單來說,訊飛輸入法的切入口是輸入服務(wù)與用戶連接的需求,也是智能化時(shí)代用戶交互的根基。

至于訊飛輸入法的路線是否正確,現(xiàn)階段還無法給出確切的答案。不妨來重溫一個(gè)屢試不爽的產(chǎn)品邏輯:更低的使用門檻,更直接的交互方式,是一切產(chǎn)品發(fā)展的方向,萬物智能時(shí)代也不例外。

再確切一些的話,包括訊飛在內(nèi)的第三方輸入法,正在不斷向金融、教育、司法、醫(yī)療、車載等場(chǎng)景滲透,輸出定制化的解決方案,為用戶帶來更好體驗(yàn)的同時(shí),也為自身找到了新的增長(zhǎng)空間。

03 輸入法的生態(tài)化破局

從最早的語音輸入到賦能萬物智能,輸入法作為人工智能技術(shù)的天然載體,不可或缺性已經(jīng)毋庸置疑,卻仍要面臨商業(yè)化的挑戰(zhàn):在工具型產(chǎn)品整體式微的局面下,輸入法的想象空間到底在哪?

回到文初的例子,像我爸這樣的用戶不在少數(shù),他們是語音輸入的直接受益者,以潤(rùn)物細(xì)無聲的方式深切改變了他們的體驗(yàn)感,一旦養(yǎng)成了語音輸入的用戶習(xí)慣,就是訊飛輸入法的護(hù)城河??刹煌谥悄荞{駛等技術(shù)的話題性,語音輸入的大眾化普及,反倒制約了講述資本故事時(shí)的吸引力。

為了改變傳統(tǒng)的市場(chǎng)認(rèn)知,訊飛輸入法代表的輸入法頭部玩家進(jìn)行了多種嘗試。典型的例子就有To B探索,面向不同的行業(yè)打造場(chǎng)景化的輸入解決方案,降低用戶在垂直場(chǎng)景里的輸入門檻;同時(shí)還有增值服務(wù)的嘗試,利用個(gè)性化皮膚、字體、表情包等吸引用戶付費(fèi),事實(shí)上,好的產(chǎn)品和有價(jià)值的服務(wù),用戶是樂于付費(fèi)的。

在訊飛輸入法12.0的發(fā)布現(xiàn)場(chǎng),面對(duì)輸入法在萬物智能時(shí)代遇到的新考題,訊飛輸入法產(chǎn)品總監(jiān)趙明路給出了生態(tài)化的破局思路。

相對(duì)應(yīng)的就是“i-Blocks”輸入個(gè)性化內(nèi)容開放平臺(tái),旨在搭建開放內(nèi)容與服務(wù)的載體,以生態(tài)開放的理念,將創(chuàng)作者、IP方、設(shè)計(jì)師、普通用戶串聯(lián)在一起,形成生產(chǎn)、消費(fèi)、價(jià)值創(chuàng)造的生態(tài)閉環(huán)。

個(gè)中邏輯并不難解釋。

進(jìn)入到萬物智能時(shí)代后,人機(jī)交互勢(shì)必會(huì)出現(xiàn)復(fù)雜多樣的一幕,不同的產(chǎn)品有著不同的交互界面,不同的場(chǎng)景有著不同的輸入偏好,不同的用戶群體有著不同的需求,想要解決新的輸入問題,既需要產(chǎn)品功能的持續(xù)創(chuàng)新,也需要內(nèi)容生態(tài)的不斷壯大,“i-Blocks”輸入個(gè)性化內(nèi)容開放平臺(tái)擔(dān)綱的正是內(nèi)容生態(tài)的建設(shè)。

以當(dāng)前最為熱門的智能車機(jī)為例,首先要解決的是輸入效率,然后是個(gè)性化的滿足。比如定制化的皮膚提升品牌的用戶認(rèn)知;再比如車機(jī)、手機(jī)、電腦的多端聯(lián)動(dòng),需要表情包、字體等元素進(jìn)行表達(dá)……當(dāng)輸入法的連接對(duì)象由過去的用戶和服務(wù),衍生到終端客戶、品牌方、創(chuàng)作者、用戶差異化需求等更多層面,內(nèi)容生態(tài)將是輸入法承接客戶訴求、滿足用戶需求的重要支撐。

找到的最新一組數(shù)據(jù)是:目前訊飛輸入法個(gè)性化內(nèi)容服務(wù)使用者中年輕用戶占比達(dá)48%,吸引了內(nèi)容創(chuàng)作者過萬人,內(nèi)容使用量多達(dá)100億次。而在萬物智能時(shí)代,內(nèi)容使用需求注定會(huì)爆炸性增長(zhǎng)。

做一個(gè)總結(jié)的話,訊飛輸入法的優(yōu)先級(jí)、競(jìng)爭(zhēng)壁壘和技術(shù)優(yōu)勢(shì),決定了其行業(yè)地位短期內(nèi)不會(huì)被挑戰(zhàn),進(jìn)一步拓寬語音輸入場(chǎng)景,并在內(nèi)容生態(tài)上不斷積蓄力量,不失為一種正確且有前瞻性的打法。

04 寫在最后

按照官方公布的數(shù)據(jù):目前訊飛輸入法的日活用戶已突破1億,語音滲透率達(dá)到75%,日語音調(diào)用量較2021年提升45%。

不難給出合理的解釋,語音為主、鍵盤觸摸為輔、肢體語言動(dòng)作為補(bǔ)充的混合交互,滿足了萬物智能時(shí)代的基本特征,既是訊飛輸入法語音調(diào)用量逐年增長(zhǎng)的誘因,也是其走向萬物智能新世界的戰(zhàn)略基石。

在語音賽道深耕十二載的訊飛輸入法,正在讓越來越多用戶擺脫人機(jī)交互的種種煩惱,改變不同代際用戶群體的交互習(xí)慣,沿循著“效率為王”的初心和恒心,賦以輸入生態(tài)新勢(shì)能、新方向、新動(dòng)能。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
訊飛輸入法

相關(guān)文章

熱門排行

信息推薦