銷量緩踩剎車的智能音箱,與狂飆的ChatGPT,能擦出什么火花?
ChatGPT帶來的生成式AI熱潮正在席卷各行各業(yè),各類智能硬件產(chǎn)品上也不斷涌現(xiàn)出新的功能和應(yīng)用。
在出貨量逐年下跌、消費(fèi)者熱情逐漸消退的智能音箱產(chǎn)業(yè),生成式AI強(qiáng)大的語義理解、用戶意圖理解以及內(nèi)容生成能力,給了這一產(chǎn)業(yè)的玩家們尋找新機(jī)遇的絕佳機(jī)會(huì)。
前有小度科技融合文心一言打造的針對(duì)智能設(shè)備場景的人工智能模型“小度靈機(jī)”,后有天貓精靈接入“鳥鳥分鳥”模型打造“AI嘴替”,并官宣將接入阿里大模型通義千問……智能音箱在生成式AI的加持下,正在變得更“聰明”,更有“人情味”。
那么,現(xiàn)在有哪些玩家已經(jīng)入局生成式AI與智能音箱的集成?生成式AI如何賦能智能音箱,而搭載生成式AI技術(shù)的智能音箱距離大規(guī)模普及還有多遠(yuǎn)?我們?cè)噲D通過追蹤各家智能音箱玩家的最新動(dòng)作并與智能音箱行業(yè)從業(yè)者對(duì)話來找到這些問題的答案。
一、巨頭動(dòng)作頻發(fā),ChatGPT是智能音箱的下一個(gè)風(fēng)口嗎?
智能音箱與生成式AI技術(shù)的結(jié)合已經(jīng)在巨頭玩家中出現(xiàn)雛形。2月9日,小度宣布將融合文心一言,打造針對(duì)智能設(shè)備場景的AI模型“小度靈機(jī)”,并將其應(yīng)用到小度全系產(chǎn)品中。4月11日,天貓精靈宣布將正式接入阿里巴巴通義千問……
眾所周知,小度、天貓精靈已經(jīng)穩(wěn)坐國內(nèi)智能音箱市場前三甲多年。洛圖科技的數(shù)據(jù)顯示,2022年中國智能音箱全年銷量達(dá)到2631萬臺(tái),百度(35%)、小米(31%)、天貓精靈(27%)、華為(4%)四個(gè)品牌合計(jì)占據(jù)了高達(dá)96.5%的市場份額。
當(dāng)下,這些智能音箱玩家也成為了生成式AI浪潮中的主力軍,走得快的一批已經(jīng)拿出了基于生成式AI技術(shù)的智能音箱測(cè)試產(chǎn)品,還有一類智能音箱玩家正在競相發(fā)布生成式AI技術(shù)領(lǐng)域的成果積累,而走得最慢的一類玩家,還尚未透露大模型領(lǐng)域的相關(guān)布局。
▲部分智能音箱玩家的生成式AI技術(shù)布局(來源:官方公開信息)
1、小度、天貓精靈搶跑,ChatGPT版智能音箱已公開測(cè)試
一類就是以小度、天貓精靈為代表的智能音箱玩家,它們已經(jīng)大踏步入局,并初步亮出了自己的成果。
小度這邊亮出的是人工智能模型“小度靈機(jī)”,借助小度靈機(jī)大模型,現(xiàn)有智能音箱中的語音助手可以變成“超級(jí)助理”。
在官方發(fā)布的測(cè)試視頻中,測(cè)試員告訴超級(jí)助理,他要在周末做各種各樣的事情,而在敘述這些事的時(shí)候,測(cè)試員會(huì)故意提出“修改時(shí)間”的要求,比如原定于周日要做的A事件被B事件替換。
即使面對(duì)測(cè)試員的一系列復(fù)雜要求,這位超級(jí)助理也可以從中提煉出真正有效的信息,并據(jù)此給測(cè)試員生成一份正確的時(shí)間安排表。
此前小度智能音箱并沒有理解這樣復(fù)雜描述并提取信息、進(jìn)行整合的能力,小度靈機(jī)模型的作用體現(xiàn)的比較明顯。
此外,在智能家居場景中的設(shè)備控制環(huán)節(jié),小度靈機(jī)大模型可以化身智能管家,更準(zhǔn)確地識(shí)別出用戶的真實(shí)需求。
在演示中,測(cè)試員告訴智能管家,“我每天早上七點(diǎn)半一定要起床,周末可以晚一些,大概九點(diǎn)左右,干脆就九點(diǎn)半吧。冬天室內(nèi)溫度不能低于23度,夏天溫度可以定在26度?!贝藭r(shí)超級(jí)助理可以根據(jù)這些描述,確定要在什么時(shí)候開啟家中的空調(diào)、調(diào)整到什么樣的溫度比較合適。
相比傳統(tǒng)智能助手只會(huì)理解“打開空調(diào)”這樣的簡單單一指令,靈機(jī)模型可以認(rèn)識(shí)到:“用戶到家時(shí),家里溫度與用戶期望的不一樣,所以需要打開空調(diào),并且根據(jù)現(xiàn)在的季節(jié)調(diào)節(jié)到合適的溫度”。
顯然,大模型的加入,可以讓智能音箱實(shí)現(xiàn)認(rèn)知能力上的提升。
▲小度靈機(jī)大模型
天貓精靈的策略是針對(duì)于智能音箱訓(xùn)練出一個(gè)個(gè)性更為鮮明的大模型。4月11日,天貓精靈宣布將接入通義千問,據(jù)阿里巴巴集團(tuán)董事會(huì)主席兼首席執(zhí)行官、阿里云智能集團(tuán)首席執(zhí)行官張勇透露,未來,天貓精靈除了能回答用戶的提問外,還會(huì)成為更人性化的智能助手。
不同于知識(shí)面更為廣泛的通識(shí)性大模型,更加垂直的“個(gè)性化大模型”面向的是家居場景中相對(duì)更個(gè)性化的需求,在這種個(gè)性化的大模型加持下,這些智能音箱產(chǎn)品可以產(chǎn)生一些特定的“人格化”特征,比如“鳥鳥分鳥”,這一模型的語氣、語調(diào)與脫口秀演員鳥鳥如出一轍,使得智能音箱在內(nèi)容生成、理解能力更強(qiáng)的基礎(chǔ)上,還增強(qiáng)了可玩性。
▲天貓精靈“鳥鳥分鳥”
2、智能音箱+生成式AI雙雙參與,華為、亞馬遜、谷歌仍緘口不言
第二類是此前在生成式AI技術(shù)以及智能音箱領(lǐng)域均有布局,但尚未透露是否會(huì)將兩者進(jìn)行結(jié)合的玩家,包括華為、亞馬遜、谷歌等。
擁有“盤古系列AI大模型”的華為,是智能音箱產(chǎn)業(yè)的重要參與玩家,從其應(yīng)用領(lǐng)域來看,華為云盤古大模型將在氣象、醫(yī)藥、游戲、稅務(wù)等方面應(yīng)用,但對(duì)于大模型在智能音箱領(lǐng)域的布局未有相關(guān)動(dòng)向公布。
亞馬遜穩(wěn)坐智能音箱市場出貨份額第一多年,上周,亞馬遜的Bedrock生成式AI服務(wù)和自有大模型泰坦(Titan)剛剛面世,相比于微軟、谷歌等,其動(dòng)作已經(jīng)落后。
不過,亞馬遜還未透露是否將其相關(guān)技術(shù)應(yīng)用于智能音箱Echo中。
今年3月,谷歌發(fā)布聊天機(jī)器人Bard后,就有外媒報(bào)道,該公司正在重組其虛擬助理部門Assistant的匯報(bào)架構(gòu),以專注于其此前推出的聊天機(jī)器人Bard研發(fā)。
谷歌副總裁兼助理業(yè)務(wù)部門負(fù)責(zé)人Sissie Hsiao說:“隨著Bard團(tuán)隊(duì)繼續(xù)這項(xiàng)工作,我們希望確保繼續(xù)支持并執(zhí)行未來的機(jī)會(huì)。今年,我們比以往任何時(shí)候都更加專注于為用戶提供有影響力的交付。”
而谷歌的智能音箱產(chǎn)品Echo是否會(huì)融入Bard的能力,谷歌尚未給出準(zhǔn)確答復(fù)。
3、蘋果、小米尚未官宣,內(nèi)測(cè)或已開啟
最后一類是以蘋果、小米為代表的玩家,這些玩家已經(jīng)深耕智能音箱市場多年,但尚未透露與大模型相關(guān)的技術(shù)研發(fā)具體進(jìn)展。
小米曾透露,其很早就在AI大模型領(lǐng)域有嘗試,采用多技術(shù)路線并行,其中,小愛同學(xué)就是典型的大模型落地應(yīng)用場景。
作為國內(nèi)智能音箱玩家前三甲,小愛同學(xué)的實(shí)踐應(yīng)用經(jīng)驗(yàn)已經(jīng)非常豐富。據(jù)了解,截至2022年12月小愛同學(xué)全球月活躍用戶1.15億。上周五,小米雷軍在微博談到大模型,并著重提到了小愛同學(xué)團(tuán)隊(duì)在AI領(lǐng)域已耕耘多年。
并且,他還透露:“我們正在研發(fā)一些有趣的技術(shù)和產(chǎn)品,等我們打磨好了,再給大家展示?!?/span>
此外,蘋果也曾在2月的內(nèi)部會(huì)議上透露,蘋果正在重點(diǎn)關(guān)注人工智能和大模型,Siri開發(fā)團(tuán)隊(duì)等在定期測(cè)試“語言生成概念”。此外據(jù)外媒9to5Mac報(bào)道,蘋果已經(jīng)在tvOS 16.4中引入了“Siri自然語言生成”的新框架。
ChatGPT的出現(xiàn)與爆火證明了生成式AI這一路線的正確性,先行的巨頭玩家也證明了智能音箱與生成式AI結(jié)合的可行性,以及生成式AI技術(shù)正在為逐漸沒落的智能音箱產(chǎn)業(yè)帶來新變量的必然性。
回溯過往,2014年亞馬遜推出全新硬件品類Echo,將智能語音交互技術(shù)植入傳統(tǒng)音箱,帶動(dòng)了智能音箱的火爆熱潮。時(shí)至今日,這一曾被科技圈眾星捧月的“黃金賽道”,卻聲勢(shì)漸熄。
二、熄火的智能音箱,在ChatGPT浪潮里尋找新變量
從市場數(shù)據(jù)來看,市場調(diào)研機(jī)構(gòu)洛圖科技的報(bào)告顯示,2022年全球智能音箱市場出貨量為1.2億臺(tái),同比下降25%;國內(nèi)智能音箱市場銷量2631萬臺(tái),同比下降28%。IDC發(fā)布的2023年中國智能家居市場的十大洞察也透露,智能音箱和視頻娛樂設(shè)備的市場需求正在逐漸消退,整個(gè)市場呈現(xiàn)下滑趨勢(shì)。
▲2017年-2022年中國智能音箱市場銷量規(guī)模變化(圖源:洛圖科技)
智能音箱產(chǎn)品中存在的交互體驗(yàn)、應(yīng)用場景單一、產(chǎn)品缺乏創(chuàng)新、互聯(lián)互通差等問題使得一些設(shè)備被放在用戶家中“吃灰”。
當(dāng)下,以ChatGPT為代表的生成式AI技術(shù)在上下文理解、多輪對(duì)話、內(nèi)容生成等方面展現(xiàn)出了極高的交互水準(zhǔn),巨頭玩家的入局也展現(xiàn)了其與智能音箱的可行性,那么從整個(gè)行業(yè)來看,生成式AI技術(shù)能為智能音箱帶來什么新的變量?
首先從基本功能來看,智能音箱曾被看好的語音交互和智能家居入口兩大功能在實(shí)現(xiàn)上與生成式AI的特性有一定相似之處。這些功能都需要智能音箱去理解用戶的真實(shí)意圖,并且生成質(zhì)量更高的答復(fù),或者能通過對(duì)用戶說話內(nèi)容上下文的理解來控制相應(yīng)的智能家居設(shè)備。
此前,智能音箱大多情況下只能實(shí)現(xiàn)一問一答或者十分簡單的溝通,依托于生成式AI技術(shù)在內(nèi)容生成和理解能力上的優(yōu)勢(shì),智能音箱可以在進(jìn)一步理解用戶意圖的基礎(chǔ)上,讓回答內(nèi)容的質(zhì)量能夠更趨向于真人的表現(xiàn)。
除了基本功能,生成式AI技術(shù)能制定計(jì)劃、生成摘要等強(qiáng)大理解能力的技術(shù)將進(jìn)一步擴(kuò)展智能音箱的應(yīng)用場景。智能音箱在語音交互方面具有聲音大而清晰的天然優(yōu)勢(shì)。未來,智能音箱的功能可能并不止于家庭,或許會(huì)走進(jìn)辦公場所成為人們工作的助手等。
從交互方式來看,生成式AI技術(shù)將會(huì)讓人與機(jī)器交互的體驗(yàn)更加流暢。ChatGPT的交互方式是文本,需要用戶打開電腦或者手機(jī),鍵入文字才能得到回應(yīng),而智能音箱則不同,其主要依靠語音,用戶不需要借助其它設(shè)備,只要智能音箱能聽到用戶聲音就可以觸發(fā)交互。
除此以外,在市場上,ChatGPT也正在帶動(dòng)智能音箱產(chǎn)業(yè)成為資本的焦點(diǎn)。據(jù)證券之星的消息,奮達(dá)科技、漫步者、國光電器等智能音箱概念股都出現(xiàn)大漲行情,資金涌入跡象明顯。
在智能音箱產(chǎn)業(yè)進(jìn)入瓶頸期的當(dāng)下,生成式AI、大模型的出現(xiàn)又將其重新拉回大眾視野,并且迅速帶來顛覆性革新,其能為這一產(chǎn)業(yè)帶來多少新變量,還需要搭載著新技術(shù)的智能音箱真正走進(jìn)家庭,我們才可能知道答案。
三、“ChatGPT版”智能音箱普及背后的三大挑戰(zhàn)
不過,想要讓搭載著生成式AI技術(shù)的智能音箱真正在每一個(gè)用戶家中實(shí)現(xiàn)普及,背后還有算力、數(shù)據(jù)、隱私等天然壁壘。
前段時(shí)間,生成式AI浪潮中最炙手可熱的ChatGPT也被踩下剎車,ChatGPT Plus暫停付費(fèi)、多國的監(jiān)管機(jī)構(gòu)禁止ChatGPT使用,這背后同樣折射出生成式AI進(jìn)入C端市場需要面臨的算力、數(shù)據(jù)安全、隱私保護(hù)的考量。
首先從算力層面來看,面對(duì)參數(shù)規(guī)模的大幅增長,“暴力堆疊”(利用大量高性能GPU)已經(jīng)成為企業(yè)提升大模型訓(xùn)練效果的主要手段,這背后高昂的成本可能成為“ChatGPT版”智能音箱落地普及的門檻。
不過算力成本高昂的問題并非無解,此前,創(chuàng)新奇智推出制造業(yè)預(yù)訓(xùn)練大模型,創(chuàng)新奇智CTO張發(fā)恩在接受媒體采訪時(shí)透露,同樣規(guī)模參數(shù)的大模型,其訓(xùn)練精度和所需算力水平其實(shí)在快速下降。
更直觀的來看就是,隨著開源大模型的出現(xiàn),一些企業(yè)不需要自己從0到1去訓(xùn)練大模型,前人被訓(xùn)練好的大模型可以直接調(diào)用,再在這一基礎(chǔ)上進(jìn)行優(yōu)化,這相比于從頭開始訓(xùn)練的大模型,其成本將少得多。
并且,未來隨著算法進(jìn)化,大模型訓(xùn)練過程中對(duì)算力的依賴度也會(huì)大大降低。
第二個(gè)挑戰(zhàn)是,ChatGPT爆火的很大一部分原因是它可以顛覆式提升生產(chǎn)效率,而這種輸出方式主要以文字、圖片、視頻為主。智能音箱則更注重語音交互,但在人們的日常生活、工作中,需要音頻反饋的內(nèi)容可能只占一小部分,大部分還是以文本、圖片、視頻輸出為主。因此,“ChatGPT版”智能音箱的普及落地需要找到一個(gè)能切準(zhǔn)用戶真正剛需,并且適配于語音交互的場景。
物聯(lián)網(wǎng)音視頻技術(shù)底層服務(wù)商相關(guān)負(fù)責(zé)人告訴智東西,站在大模型的角度,它對(duì)意圖理解、情緒理解、個(gè)性塑造和反思能力有很強(qiáng)的表現(xiàn)并擅長內(nèi)容創(chuàng)作等,但此前智能音箱的交互還停留在機(jī)械式問答。
他補(bǔ)充道,未來可能會(huì)誕生一些陪伴型的設(shè)備形態(tài),當(dāng)然也有可能有別于現(xiàn)有的智能音箱。
如果仍然以聊天對(duì)話、控制智能家居設(shè)備的功能為主,搭載“ChatGPT”的智能音箱可能很快也會(huì)褪去熱度,再次沉寂,因?yàn)檫@看起來與之前的智能音箱相比并沒有很大區(qū)別。
第三個(gè)挑戰(zhàn)就是,對(duì)于用戶家庭數(shù)據(jù)、隱私安全的保護(hù)。消費(fèi)者對(duì)于智能音箱收集個(gè)人數(shù)據(jù)的問題一直比較敏感,如果想要搭載生成式AI技術(shù)的智能音箱可以更好地理解用戶需求,并給出個(gè)性化解決方案,那么生成式AI勢(shì)必會(huì)涉及到對(duì)用戶個(gè)人信息的收集。
此時(shí)用戶對(duì)于這類產(chǎn)品是否會(huì)接受,以及相關(guān)法規(guī)法律的健全完善,都會(huì)是行業(yè)要面對(duì)的挑戰(zhàn)。
因此,當(dāng)一個(gè)更聰明的智能音箱出現(xiàn)在用戶家庭中,勢(shì)必會(huì)經(jīng)歷較長的市場教育階段。
一項(xiàng)新技術(shù)的革新以及對(duì)整個(gè)產(chǎn)業(yè)產(chǎn)生實(shí)際的影響必然是長期過程,而這一波AI新浪潮仍處于發(fā)展的早期,因此其對(duì)于智能音箱這一產(chǎn)業(yè)產(chǎn)生的切實(shí)影響可能還未明確展現(xiàn)出來。
現(xiàn)在,我們還無法給出類ChatGPT技術(shù)在智能音箱中廣泛應(yīng)用、引起真正革命的確切時(shí)間,但可以預(yù)見的是,ChatGPT引爆的熱潮正在加速這一進(jìn)程。
結(jié)語:解密AI帶給智能音箱的想象空間
隨著生成式AI技術(shù)的快速發(fā)展,日漸熄火的智能音箱產(chǎn)業(yè)將有望找到新的增長空間。在此基礎(chǔ)上,智能音箱等智能終端設(shè)備的人機(jī)交互模式也將帶來新的變革。
多年以來,曾靠語音助手紅極一時(shí)的智能音箱一直沒發(fā)展出什么爆款新功能,也沒有出現(xiàn)令人驚艷的重磅升級(jí),使得消費(fèi)者的換新需求大打折扣,如今這類上知天文下知地理、還能擁有情感陪伴的生成式AI技術(shù),未來如能和智能語音助手結(jié)合在一起并落地到用戶家中,將有望帶給智能音箱產(chǎn)業(yè)新的生機(jī)。
不過對(duì)于其未來能產(chǎn)生哪些新的場景、新的應(yīng)用?智能音箱的形態(tài)又會(huì)發(fā)生什么樣的變革?目前還未有定論。
文章轉(zhuǎn)載自智東西