- +1
向前一步,流媒體網絡押注Unified?
我們在尋找「網絡」的全盤解法。
音視頻數字化在消費領域的紅利儼然見頂,而產業級視頻應用激活了更多場景下的業務模式。與此同時,音視頻客戶也從單一的業務需求,趨向于多種業務并行存在的需求。
固有的網絡能滿足新興的業態嗎?延時與成本之間存在區間最優解嗎?業務的升級切換如何不再費時費力?在成本可控下網絡的穩定性怎樣保障?
一張多元融合的流媒體傳輸網絡可否解決全盤之困?
面向未來的流媒體傳輸網絡,又將從何揭開其神秘面紗?
本文由IMMENSE、「阿里云視頻云」通訊服務負責人黃海宇和LiveVideoStack策劃、采訪而成。
網絡新基建,若隱若現
降本還是網絡最大痛點嗎?“元數據”是新主角嗎?
網絡基礎設施升級、音視頻傳輸技術迭代、WebRTC開源等發展,音視頻業務在消費互聯網領域蓬勃發展,并逐漸向產業互聯網領域加速滲透。
然而,行業紅利期退卻之后,以往隱蔽的音視頻業務現象,逐漸顯露。
一方面,“降本”是持續熱議的話題。而在音視頻應用中,網絡傳輸在IT成本中占比很高,例如,在一個典型的直播應用中,網絡傳輸成本占總成本70%以上。于是,在降本增效的大背景下,降低網絡傳輸成本,是行業客戶和云廠商共同面臨的課題。
另一方面,“延時”帶來更多價值和空間。從消費端的實時交互,到產業端的實時遠程,對視頻流的延時要求越來越高, 在云渲染、云游戲、數字虛擬場景中,涉及復雜的編碼、解碼、傳輸環節,而最復雜的瓶頸就在于傳輸網絡的時延,但網絡的構成與影響因素高度復雜,對其延時的提升也是極大挑戰。
與此同時,新趨勢的生長也帶來更多挑戰。
不久前,蘋果Vision Pro在 WWDC 2023 亮相,推出其首個空間計算設備,將熱度漸消的元宇宙重新拉回大眾視野。
圖片來源于網絡
對未來的想象,不再局限于頭盔上的渲染視頻,更涉及到云端的交互與合成。然而,元宇宙的真正繁榮,不僅需要MR硬件終端的性能升級,更取決于流媒體傳輸網絡的迭代演進。
我們發現,當下的海量視頻主要基于傳統拍攝模式而生,可以預想,未來源自渲染合成的視頻比例將顯著增加,這一趨勢勢必帶來海量的計算和傳輸需求,同樣也帶來計算成本和傳輸成本的極大考驗。
同時,這也意味著網絡需要承載更加不可估量的數據量級,這其中,不僅有常規的音視頻,更涵蓋更多維度的數據傳輸,比如基于遠程場景、云游戲下的控制信令數據、用于控制渲染視頻生成的“元數據”,可以表達更復雜的立體場景信息。
如此來看,需要一張承載多元內容的強大網絡,同時提供高性能的云邊計算能力,其作為新基建才能支撐未來式的視頻化業態。
「Unified」能解決所有關鍵嗎?
更低成本、更低延時、更多算力結合、更多維內容傳輸,這些無疑都是傳輸網絡的趨勢關鍵,而怎樣的招式可以全盤解決?也許是“Uni”。
Uni源于Unified,意味著“統一”。
在網絡上,我們正在探索落地更好的“Uni”技術、真正的“Uni”能力,創造由“Uni”帶來的業務價值。
阿里云視頻云基于廣泛的異構節點,構建了全分布式、超低延時、多業務支撐的多元融合流媒體傳輸網絡——MediaUni。
這是在我們的全球實時傳輸網絡GRTN之上,以“大一統”的理念對網絡深化設計,實現網絡底座的全新升級。
MediaUni打通底層資源,統一技術架構,以一張流媒體傳輸網絡,實現音視頻應用中多形態的內容傳輸,并滿足更低成本、更低延時的多元融合業務需求。
延時可以是自由的
任何延時的業務,都能跑在一張網上?
得益于底座能力和關鍵技術的持續突破,音視頻服務已實現了從傳統的點播、直播,到實時音視頻的深化發展,未來,還將撬動傳統行業中眾多強實時、強互動場景的數字化升級。
其中,“時延”首當其沖成為最需攻克的難題之一。
以一張網,MediaUni能夠支撐全域延時的業務:
從普通直播(HLS/FLV)、到基于WebRTC技術的超低延時直播RTS(約1s左右延遲)、再到實時音視頻傳輸(如直播連麥、遠程監考等場景),同時,更可支持對延遲要求極高的云渲染、實時遠程控制等業務,實現所有業務真正跑在一張網上。
延時“搶跑”,怎樣實現?
從根本上看,網絡的延遲源自兩方面:物理的延遲與IP網絡的不可靠。
為對抗物理的延遲,MediaUni基于全球3200+邊緣下沉節點的就近分布,縮短了與用戶之間的“最后一公里”,縮短數據的傳輸路徑,以便更快感知傳輸網絡質量的變化。
通過將渲染服務部署到靠近用戶的節點,阿里云視頻云在雙11支持淘寶直播全真虛擬互動空間“未來城”,實現超萬路并發在線的虛擬直播,并在2023央視春晚,以低延時傳輸云渲染技術打造了首個元宇宙廟會,實現極致的超低延時體驗。
淘寶3D虛擬電商空間“未來城”
在對抗IP網絡的不可靠性上,MediaUni設計了實時感知系統,實現對節點的負載、鏈路的網絡狀況、以及業務關鍵信息的秒級感知,并基于感知數據,智能調整調度策略與路由策略,可以更好地分配物理資源,選擇服務質量更高的物理鏈路。
同時,通過不斷迭代的QoS技術,在擁塞控制、FEC、多徑傳輸等方向持續優化,對抗網絡中的丟包、延遲與亂序,以滿足更低的網絡延時。
目前,科學界公認的人類極限反應速度為100毫秒,一般人的反應在0.2~0.3秒間,在百米賽跑中,槍響后的0.1秒內起跑會被視為“搶跑”,而MediaUni支撐實現的云渲染場景,已突破60ms以內的端到端交互延時,可謂音視頻延時的“搶跑”。
延時vs成本,網絡可以handle?
眾所周知,在網絡優化到一定程度以后,延時和傳輸成本會成為一對矛盾。
例如,在帶寬允許范圍內,為對抗丟包,協議棧不惜代價進行重傳或增加FEC,有效降低傳輸的延遲,但會因此付出更高的傳輸成本。
在行業普遍追求“快與更快”之際,低延時與低成本之間,是否有兩全之法?
對此,MediaUni的精要在于將降低延時的手段與增加傳輸成本進行量化,再根據業務的場景提供ROI最高的綜合方案,將每個bit的傳輸價值都發揮到極致。
? 對于普通的娛樂直播,其互動方式為彈幕,可以采取5s左右的FLV直播;
? 對于世界杯等賽事直播,可選用延遲1s左右的低延時直播;
? 對于電商直播,通過AB測試發現,采用延時低于1s的互動直播,能夠對GMV有一定的提升。
由此可見,能夠針對不同業務場景進行網絡的精細化運營,自由選擇成本可控的業務延時,才是真正的“延時自由”。
多元融合,紅利釋放
業務復用,就是最大的技術普惠?
依托于強大的底層基礎設施資源,和長期積累的音視頻技術能力,相比于其他賽道玩家,云廠商在網絡服務中具備規模優勢。
此外,通過一張網絡支持多元業務,“業務復用”本身將持續釋放技術紅利。
“紅利”可以透過三點顯現:
第一,業務混跑,驅動資源復用率的提高。
不同業務的錯峰復用率會更高,從而帶來更高的計算資源、網絡資源復用率,如大部分會議、遠程監控等業務都處于白天工作時間,這與互聯網娛樂等“夜間經濟”形成很好的錯峰運行。
第二,技術復用,帶來研發邊際成本的降低。
在流媒體傳輸中,無論是音視頻還是消息信令的傳輸,無論是直播還是實時通訊業務,都需要解決基于大量節點的路由問題、全局的快速信息感知問題、協議棧優化抗弱網問題。
通過使用一張網絡支持多元業務,可以復用這些基礎技術,使得在同樣的研發投入上,獲取更優的技術指標。
第三,云產品的使用更便捷、更高效。
由于多業務的支撐,用戶可以更方便地升級服務或者組合出新的場景化方案。
例如,通過阿里云控制臺,用戶只需“一鍵升級”,就可以將延時5s左右的普通直播,切換成延時僅為1s的超低延時直播RTS,或者延時在400ms以內的互動直播。
從資源利用、研發成本,再到產品使用,一張多元融合的網絡實現了最極致的紅利釋放。
支持的業務多了,會打架嗎?
在駕馭“Uni”之下的多元業務時,MediaUni不可避免面臨著許多技術挑戰。
其中,最大的挑戰,來自于多業務復用之后對工程能力的要求。
一張網絡支持多個業務以后,需要解決業務之間相互影響的問題,解決業務功能快速迭代的問題。
而MediaUni,通過良好的模塊化設計來進行業務的隔離,減少不同業務的相互影響;同時,MediaUni構建了可編程能力,對于一些簡單的業務需求,可以通過運行時可編程來解決,從而滿足業務功能的快速迭代。
再者,多元業務復用的另一個技術挑戰,來源于資源的復用,即不同業務對資源消耗的瓶頸可能不同,例如直播的瓶頸在于帶寬,音視頻通訊中復雜的QoS策略可能帶來CPU的瓶頸,這時候需要更智能的調度系統來對不同業務進行編排。
未來的N種可能
一張傳遞“人類五感”的網
在過去的幾十年中,通過一代代技術人的努力,人類的視覺和聽覺已經得到了較好的數字化呈現,實現了如今低延時、高可靠的音視頻體驗。然而,人類的感覺除了視覺與聽覺之外,還包括嗅覺、味覺、觸覺等。
可預見的是,沉浸式XR作為面向未來的交互形態,將需要同時對嗅覺、味覺、觸覺等感官信息進行完全模擬和實時交互,從而實現用戶體驗擴展與人機互動,給用戶創造身臨其境、感同身受的逼真體驗。
面向未來的流媒體傳輸網絡,將實現更多維數據的高效傳輸。
未來,網絡將支撐多種感覺(如味覺、嗅覺、觸覺甚至情感等)的互動通信,人類多維感知的數據化、交互協作,也將在同一張網內進行。
如同游戲手柄上的震動一般,刺激著一個復刻真實世界的真正元宇宙誕生。
三管齊下,優先布局
為了支持未來多感官的音視頻應用,流媒體傳輸網絡將具備毫秒級的延時、與計算的緊密結合、元數據的傳輸能力三大關鍵特征,而MediaUni多元融合流媒體傳輸網絡正在這三個方面化深度演進。
? 高質量的毫秒級延時
在音視頻全鏈路延時中,網絡傳輸延時,是其中最困難、優化空間最大的部分。
MediaUni通過大量的節點覆蓋和極具媒體特性感知的QoS優化,在云渲染場景已達60ms以內的端到端延時,并持續探索更低延時的傳輸能力,未來將在20-100ms之間尋求延時的極致與質量的平衡。
? 收放自如的算網
網絡天然就靠近用戶,我們希望通過網絡連接分布式資源,有效促進算力資源的按需“流動”,彌補終端算力的不足。
利用全球廣域的分布式計算能力,MediaUni正在實現計算與傳輸的統一調度,已將部分實時媒體處理的業務部署在傳輸網絡上,并支持實時啟動處理任務,在降低用戶延時的同時,有效優化媒體的網絡傳輸成本。
? 元數據傳輸
元數據(Metadata),越來越成為音視頻產品的一部分,結合元數據自定義音視頻功能,可以更好滿足場景的個性化需求。尤其在通向“人類五感”傳輸的網絡世界里,多維感官的數據化、精準化,更需要元數據的支撐。
在音視頻傳輸之外,MediaUni也支持更多維度的數據內容,例如消息信令的傳輸,進而可以擴展到更豐富的IM、多場景遠程控制、元宇宙等業務。未來,隨著多感官網絡通道的真正打開,MediaUni將發揮更大的能量。
面向未來,MediaUni將如何實現「多元融合」下的新升級?
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司