我們的生活、工作正在被越來越多的設(shè)備連接起來,從家庭中大大小小的智能家居設(shè)備,到每天佩戴的智能手表,以及出行工具汽車的智能化、網(wǎng)聯(lián)化。與此同時,這些設(shè)備也正在通過音頻或視頻的實時互動方式,最終使得人、設(shè)備和家庭、工作場景無縫連接起來。
就在上周末,聲勢浩大的中國家電及消費(fèi)電子博覽會(AWE)落下帷幕,可以看出,這場家電盛宴中,越來越多的智能家居設(shè)備在互動中都需要音視頻技術(shù)的支持,并讓用戶擁有酷炫、沉浸式的互動體驗。
多了一塊屏幕的冰箱、有語音交互能力的電視……都預(yù)示著擁有“眼睛”和“耳朵”已經(jīng)成為智能家居設(shè)備的硬指標(biāo)。
作為全球?qū)崟r互動API平臺開創(chuàng)者和引領(lǐng)者的聲網(wǎng),同樣看到了這一趨勢。在AWE同期的GTIC 2023全球AIoT智能家居峰會上,聲網(wǎng)IoT負(fù)責(zé)人侯云憶以《聲網(wǎng)實時互動:開啟智能家居「真互動」時代》為主題進(jìn)行了演講。
▲聲網(wǎng)IoT負(fù)責(zé)人侯云憶
那么,智能家居的“真互動”時代到底是什么?在這一背景下,聲網(wǎng)在其中扮演了什么樣的角色?實時互動技術(shù)又將為智能家居行業(yè)帶來哪些新的變量?我們試圖從聲網(wǎng)的布局中找到這些問題的答案。
一、以人為中心,跨越距離、空間和設(shè)備限制
智能家居設(shè)備的邊界正在以人為中心不斷向外延伸,而交互屬性更強(qiáng)、用戶感知度更高的實時互動技術(shù)正在這之中迸發(fā)出旺盛的生命力。
侯云憶說,幾乎每個家庭里都會有三到五個音視頻設(shè)備,而這些設(shè)備正在從家庭這個物理空間內(nèi)向外拓展,根據(jù)用戶需求連接到更多的應(yīng)用和終端上。而這些硬件設(shè)備也正在被實時互動賦予新的形態(tài)、角色和定位。
作為用戶智慧家庭的入口,擁有視頻畫面的智能門鎖已經(jīng)成為這一行業(yè)的標(biāo)配。這都得益于視頻畫面帶給智能門鎖的新變量,不同的設(shè)備通過同一屏幕畫面進(jìn)行了連接,并且智能門鎖的角色定位已經(jīng)從簡單的監(jiān)控、門鈴功能,圍繞著用戶的需求不斷滲透至人們生活的方方面面,如今,這一設(shè)備已經(jīng)與用戶的智能手機(jī)、家中的智慧屏、智能汽車的終端設(shè)備實現(xiàn)了跨場景、跨設(shè)備的互聯(lián)互通。
▲華為智能門鎖Pro可以與智能手機(jī)、智慧屏相連接(圖源:華為官網(wǎng))
此外,人們對智能家居設(shè)備遠(yuǎn)程互動和情感連接的需求正在日益增長。以智能攝像頭為例,除監(jiān)控這一基本功能外,搭載音視頻技術(shù)的智能攝像頭可以化身人們聯(lián)系遠(yuǎn)程朋友、親屬的工具,其作用已經(jīng)從簡單的監(jiān)控安全升級至情感連接和提供陪伴服務(wù)。
亞馬遜此前發(fā)布的家庭助理機(jī)器人Astro,更是通過音視頻為原先冷冰冰的機(jī)器人賦予了“機(jī)器人家庭管家”的角色。
▲亞馬遜家庭助理機(jī)器人Astro支持遠(yuǎn)程視頻通話(圖源:亞馬遜)
事實上,實時互動帶來的新變量不止于此,一些屏幕出現(xiàn)在了很多意想不到的場景中。侯云憶稱,在智能教育賽道上,各類搭載屏幕的臺燈、桌子等新設(shè)備層出不窮,這些與學(xué)生學(xué)習(xí)息息相關(guān)的硬件設(shè)備,通過音視頻增加了一鍵連線家長、老師,輔助教學(xué)等增值服務(wù),使其在教育場景下成為能輸出高質(zhì)量內(nèi)容且有高粘性需求的品類。
可以看出,實時互動技術(shù)正在以人為中心,從用戶的不同需求、不同場景出發(fā),拓展硬件設(shè)備的形態(tài)的同時賦予其連接用戶家庭情感的紐帶。
綜上,這些硬件設(shè)備角色的延伸,也預(yù)示著兩大趨勢。侯云憶認(rèn)為,首先,智能硬件設(shè)備正在從單品智能向場景智能以及以人為本的終端互聯(lián)邁進(jìn),其次,能多人多端實時交互的屏幕,正在使得這些設(shè)備從工具化身為人與人之間情感連接的角色。
智能硬件角色轉(zhuǎn)變的背后,是實時音視頻技術(shù)的發(fā)展。侯云憶認(rèn)為,早期的智能設(shè)備通過P2P技術(shù)只能達(dá)到即時預(yù)覽、能看能聽,而目前這些智能設(shè)備之所以能化身以人為中心的情感連接和陪伴,是因為進(jìn)入了“真互動”時代,聲網(wǎng)為這個行業(yè)定義的“真互動”就是全球端到端400ms級別以下的超低延遲,可以在全球任意終端、任意形式、任意規(guī)模實現(xiàn)隨時隨地互動無界的交互。
可見,以人為核心的“真互動”時代正在向智能家居滲透,并逐漸成為標(biāo)配。
基于這樣的思考,聲網(wǎng)的IoT解決方案已經(jīng)布局了面向智能穿戴、家居和出行領(lǐng)域等共40+的品類設(shè)備?;谶@些場景和設(shè)備,聲網(wǎng)提供了包括實時音視頻、媒體加速和可靠信令等PaaS服務(wù),幫助這些設(shè)備提供遠(yuǎn)程實時監(jiān)控、視頻通話和遠(yuǎn)程應(yīng)急協(xié)作等服務(wù)和功能。
二、首創(chuàng)全球軟件定義實時網(wǎng),刷新互動體驗天花板
可以看出,實時互動技術(shù)廣泛應(yīng)用于智能家居設(shè)備已經(jīng)成為必然趨勢,這也在硬件設(shè)備廠商之間達(dá)成了共識。但其對于硬件設(shè)備廠商而言并不是一件容易的事,它們不僅要從頭開始研發(fā),還需要考慮開發(fā)難度、部署難度、運(yùn)維難度以及這背后的成本。
“我們希望設(shè)備廠商在硬件不增加成本的情況下,通過聲網(wǎng)的IoT解決方案,在網(wǎng)絡(luò)、音頻和視頻幾個方面,能夠突破網(wǎng)絡(luò)限制、平臺限制和設(shè)備限制做到互聯(lián)互通,讓本身的低端設(shè)備也可以做到高端體驗,使用戶能獲取高質(zhì)量互動體驗。”侯云憶透露。
作為在實時互動領(lǐng)域的專業(yè)玩家,聲網(wǎng)深耕在實時音視頻領(lǐng)域數(shù)年,并一直圍繞物聯(lián)網(wǎng)設(shè)備和場景去不斷優(yōu)化實時互動用戶體驗。依托于聲網(wǎng)自研的全球軟件定義實時網(wǎng)—SD-RTN,可以讓硬件設(shè)備突破網(wǎng)絡(luò)限制,即使在弱網(wǎng)的情況下,也能保障80%丟包下音視頻通話流暢。
在面向場景的深度適配上,聲網(wǎng)的智能人居解決方案適配了安卓、鴻蒙、LiteOS、小米VelaOS等主流操作系統(tǒng),以及為硬件廠商提供了軟硬一體以及官方適配的SDK,如有樂鑫科技、BEKEN等能滿足低功耗音視頻設(shè)備場景的品牌,也有英偉達(dá)等面向高性能計算的解決方案組合。
此外,智能家居設(shè)備的碎片化特征,導(dǎo)致設(shè)備形態(tài)、種類豐富多樣,想要提升用戶的使用體驗,聲網(wǎng)解決方案需要考慮到更多智能硬件設(shè)備的需求。侯云憶稱,聲網(wǎng)目前是整個行業(yè)里RTC廠商當(dāng)中覆蓋平臺以及能夠做到互聯(lián)互通終端最全、最多的廠商,其解決方案能覆蓋手機(jī)、音箱、小程序、智慧屏等多個終端。
值得一提的是,聲網(wǎng)的解決方案同時支持對接第三方生態(tài),能夠?qū)崿F(xiàn)主流Amazon Alexa和Google Assistant在海外的協(xié)議互通。
“過去硬件本身的性能可能決定了用戶體驗的上限,我們希望幫助伙伴,在不增加硬件和不增加云端算力的情況下,能夠突破硬件使用的上限。”侯云憶介紹,以視頻門鈴或者門鎖的場景為例,當(dāng)硬件資源不足或者帶寬不夠、網(wǎng)絡(luò)差的情況下,畫面的畫質(zhì)會變差,但通過客戶端的視頻增強(qiáng)方式,基于深度學(xué)習(xí)的自研超分算法,可以支持1.5倍、2倍、3倍的移動端實時超分,幫助硬件從360P增加到720P,提升畫質(zhì)清晰度。
不僅如此,聲網(wǎng)的多項音視頻黑科技不斷刷新用戶互動體驗天花板,有專為實時互動打造的自研高清語音引擎, 視頻增強(qiáng)策略、實時美聲算法、AI降噪和回聲消除能力等技術(shù),讓用戶擁有更高保真、更趣味、更高清畫質(zhì)的音視頻體驗。
在實時互動這條路上,聲網(wǎng)不斷深耕打磨自己的技術(shù),進(jìn)一步讓音視頻技術(shù)賦能于硬件設(shè)備上。其和智能家居硬件廠商的角色也正印證了這句俗語:讓專業(yè)的人做專業(yè)的事。
三、實時互動生態(tài)能力凸顯,不斷突破硬件能力邊界
當(dāng)一個趨勢成為行業(yè)共識的時候,參與者的相互碰撞必然會產(chǎn)生新的火花。
聲網(wǎng)去年推出靈隼物聯(lián)網(wǎng)云平臺至今已近一年時間,在這個過程中,實時互動與智能家居設(shè)備碰撞出的火花也越來越多。
智能家居產(chǎn)業(yè)上游,更多的芯片廠商正在將實時互動作為產(chǎn)品規(guī)劃標(biāo)配。侯云憶認(rèn)為,這也體現(xiàn)了上游廠商對音視頻的重視程度在不斷提高。
此前,芯片和模組原廠很少關(guān)注其產(chǎn)品會較多出現(xiàn)在哪些細(xì)分場景或哪些硬件設(shè)備中,但隨著實時互動技術(shù)的成熟,智能家居在其中的參與度越來越高。與此同時,聲網(wǎng)作為軟件提供商與上游玩家進(jìn)行軟硬件結(jié)合的過程中,也開始探索新的使用場景。
一定程度上,這一產(chǎn)業(yè)模式也會推動應(yīng)用端設(shè)備的創(chuàng)新與迭代,智能家居玩家會去競爭實時互動領(lǐng)域的差異化能力,例如一些互動性更強(qiáng)的寵物機(jī)器人、割草機(jī)器人等。當(dāng)這一技術(shù)成為基準(zhǔn)后,其在智能家居設(shè)備上體現(xiàn)出的能力也更具多樣性。侯云憶補(bǔ)充說,雖然很多品類的布局在他們預(yù)期之內(nèi),但開發(fā)者拓展過程中給了他們很多驚喜。
在這個過程中,聲網(wǎng)的靈隼物聯(lián)網(wǎng)云平臺更像撬動實時互動在智能家居領(lǐng)域應(yīng)用的關(guān)鍵樞紐,真正讓這一技術(shù)在上中下游之間“開始游動”,使得整個產(chǎn)業(yè)鏈開始關(guān)注這件事。
而置身其中的參與者聲網(wǎng)的感受也更為深刻。2020年,聲網(wǎng)和小天才合作落地了全球首個RTOS兒童電話手表,成為業(yè)內(nèi)獨(dú)家實現(xiàn)RTOS平臺量產(chǎn)實時互動全功能服務(wù)的企業(yè)。侯云憶透露,聲網(wǎng)解決方案為兒童手表提供了音視頻通話能力,擴(kuò)展了它的場景,也就是“用軟件去提高兒童手表這類低功耗設(shè)備的能力上限” 。
這些經(jīng)驗的積累,也成為聲網(wǎng)不斷探索新場景,并轉(zhuǎn)化為自己在智能家居領(lǐng)域積累的技術(shù)優(yōu)勢。
目前,聲網(wǎng)已經(jīng)和國內(nèi)智能攝像頭、智能門鈴、智能門鎖等行業(yè)的頭部玩家達(dá)成合作,在軟件的加持下,讓實時互動技術(shù)的優(yōu)勢更廣泛的體現(xiàn)在智能家居設(shè)備中。
面向未來,生成式AI技術(shù)強(qiáng)大的內(nèi)容生成、理解、推理能力也帶給了人機(jī)交互更大的想象空間,與此同時,大模型加持下的設(shè)備能更懂人、更理解人,那么人對基于此的智能家居設(shè)備黏性也一定會被提高。侯云憶認(rèn)為,前沿技術(shù)的加持下未來可穿戴設(shè)備、家庭機(jī)器人等設(shè)備的需求將會爆發(fā),這一趨勢對于這其中實時互動能力的建設(shè)等都會有巨大的推動作用。
結(jié)語:實時互動正在與智能家居擦出火花
各類前沿技術(shù)的出現(xiàn)與快速發(fā)展正在賦予智能家居新的想象空間,同時,實時互動技術(shù)的出現(xiàn)為智能家居玩家?guī)砀鄵碛胁町惢偁巸?yōu)勢的可能性。不過,這離不開以聲網(wǎng)為代表的專業(yè)玩家的技術(shù)支撐。
當(dāng)下,我們已經(jīng)看到實時互動在智能家居設(shè)備之中的必要性,被賦予“眼睛”和“耳朵”的硬件設(shè)備正頻繁出現(xiàn)在我們的生活中,硬件設(shè)備承載的信息密度正在不斷提升,并且視頻、音頻、圖片等多模態(tài)信息的大量輸入輸出。
正如侯云憶所說,聲網(wǎng)的愿景是希望實時互動可以像水和空氣一樣無處不在。實時互動技術(shù)未來可能讓智能家居設(shè)備的形態(tài)、用戶體驗等方面都產(chǎn)生質(zhì)的飛躍。
轉(zhuǎn)自智東西