- +1
對話镕銘微電子蔡媛:深入理解用戶痛點,滿足差異化需求
“芯片不僅僅是一個硬件產品,為了更好的貼近用戶、服務用戶,我們需要在固件和軟件的框架上投入足夠的研發資源,與客戶同步迭代更新,以適應其快速的業務迭代要求。在深入理解用戶需求和痛點的基礎上,滿足用戶差異化的功能需求。”LiveVideoStack 很榮幸地邀請到了镕銘微電子 解決方案架構總監 蔡媛老師,和大家聊一聊硬件芯片在當前視頻行業環境下所面臨的機遇與挑戰,以及硬件芯片產品開發與方案設計應該如何更好地貼近用戶、服務用戶,滿足其更深層次的需求。
蔡媛 (Amy.Cai),镕銘微電子,解決方案架構總監
LiveVideoStack:Amy 老師您好,非常高興能邀請到您接受采訪。首先,跟讀者朋友們介紹下您自己吧。
Amy:大家好,我是蔡媛 Amy。目前在镕銘微電子負責產品解決方案相關的工作,主要面向視頻行業客戶提供 VPU 芯片和高性能存儲的產品解決方案。此前我在國內獨立云計算公司擔任視頻云產品技術總監,主導點直播 / 云游戲相關的媒體處理、265 編碼、視頻質量評測體系的建設和產品研發工作。更早時間就職于搜索公司基礎架構團隊,從事分布式存儲系統和存儲引擎相關的質量和開發工作。
LiveVideoStack:說一說您所關注的領域、技術以及目前的一些工作重點吧,有哪些有意思的事情或心得體會?可以跟大家分享一下。
Amy:近幾年我主要是在視頻處理和視頻分發領域從事產品技術方面的工作,加入镕銘微電子后開始深入了解 VPU 芯片以及 AI 處理與視頻芯片結合相關的產品,并與我們的產品技術團隊一起打磨行業解決方案,包括視頻直播、點播、云游戲、云桌面、OTT 等領域,實現行業功能需求,為客戶提供高效的視頻處理方案。
以云游戲為例,為了滿足云游戲全鏈路百毫秒以下延遲的要求,我們采用低延遲模式、零拷貝、多線程編碼等技術,實現更低、更穩定的編碼延遲。對于云游戲服務提供商而言,成本方面目前壓力還是非常大的,其中帶寬成本占超過 50%。镕銘微電子最新一代編碼器 Quadra 在相同畫質下,較 NVIDIA T4 llhp 模式可節省 30% 以上的帶寬。同時,我們還提供了碼率平滑的功能,方便客戶對碼控有更多的控制,降低帶寬波動。這些都是在與客戶磨合過程中,從硬件層到軟件層逐步完善優化的結果,為云游戲客戶提供更具產品競爭力的解決方案。
在與客戶對接的過程中我們體會到芯片不僅僅是一個硬件產品,為了更好地貼近用戶、服務用戶,我們需要在固件和軟件的框架上投入足夠的研發資源,與客戶同步迭代更新,以適應其快速的業務迭代要求。在深入理解用戶需求和痛點的基礎上,滿足用戶差異化的功能需求。
LiveVideoStack:互聯網視頻內容的爆發增長,以及內容質量、分辨率要求的不斷提升,帶來了更高的視頻處理算力及編解碼性能需求。在這樣的市場環境下,存在哪些機遇與挑戰?镕銘微電子有哪些相應的工作與布局?
Amy:互聯網視頻內容的爆發增長對算力和帶寬的要求急劇提高,視頻流媒體已取代文字、圖片等形式成為主流,直播、點播、短視頻等視頻應用已經占據互聯網 80% 以上的流量。視頻行業對于清晰度和流暢性的追求貫穿始終,需要不斷提升分辨率、幀率、色域等參數以實現更好的視覺效果,4K、8K、10bit、HDR 已逐步在各大視頻平臺呈現出很好的效果。更進一步,視頻將以感知和連接現實與虛擬世界為出發點,向三維立體的維度發展,衍生出原生云游戲、實時渲染、數字孿生等需求。傳統的軟件編碼方式、其密度和 TCO 成本,已經無法應對這些帶來的爆炸式的算力需求增長,VPU 解決方案是一個必然的選擇。
镕銘微電子最新一代產品 Quadra 單卡最高支持 8K 60FPS 的實時編解碼,并實現低于百毫秒的延時。而 H.265 軟編在 8K 60FPS 場景需要做大量的幀級 / 宏塊級并行優化 + 復雜的分布式系統才能實現秒級延遲的直播效果。Quadra 同時支持 H.264/H.265/VP9 解碼,以及 H.264/H.265/AV1 的編碼,是全球首個支持 AV1 編碼的硬件編碼器。在畫質方面,Quadra 較上一代產品從直播畫質提高到點播處理要求的畫質水平。在密度方面,在 PCIe lane 充足的 NVME SSD 機型的服務器,最高可以支持 24 張 U.2 形態的卡,整機可達 768 路 1080P 30FPS 編解碼。在互聯網對媒體算力要求爆炸性增長的環境下,镕銘微電子 VPU 能夠幫助客戶以最低的成本實現媒體處理能力的迭代升級。
LiveVideoStack:對比 CPU、GPU、FPGA、ASIC 等硬件方案,考慮需求以及各項條件因素的影響應該怎樣選擇?
Amy:頭部互聯網公司和云計算公司都有異構計算平臺,不同的方案有各自適合的場景以達到成本最優的目標。
GPU 相對而言單路碼流成本是非常高的,更適合對超級熱流做超分超幀、畫質質量檢測、深度畫質增強的處理。FPGA 具備可編程的屬性,成本也非常高,一塊高性能 FPGA 成本就要幾千美金。ASIC 編解碼芯片在滿足超高清視頻編解碼的需求前提下,其 TCO 成本僅為行業性能領先的軟件編碼器成本的 1/15 - 1/20,在密度和能耗上有顯著優勢,適合于大規模的視頻編解碼處理。谷歌在 2021 發布了其 Argos ASIC 視頻處理芯片用于 YouTube/Google album 等應用,每年節省數億美元的費用。镕銘微電子的 VPU 視頻處理芯片相較谷歌的 Argos 擁有更多功能和更強能力、更低功耗、以及更加優秀的系統適配能力,并已經得到海內外市場上多家大型客戶的廣泛使用和驗證。
LiveVideoStack:镕銘微電子推出了首款商業硬件 AV1 編解碼芯片,過去一段時間,其在性能、規模化應用等各方面的表現和反饋如何?后續還會有怎樣的優化?
Amy:我們在 2021 年 11 月發布了全球首款 AV1 硬件編碼器,為 AV1 在線視頻處理提供了可行的選項。新一代產品 Quadra 的 AV1 編碼器單芯片最高編碼性能可達 32 路 1080P 30FPS 實時編碼,在一臺 1U 的服務器上插上 10 塊 Quadra U.2 形態的卡,整機可支持 320 路 AV1 實時編碼。高性能模式下,畫質優于開源軟編器 SVT-AV1 的畫質;高畫質模式下,性能消耗遠低于 SVT-AV1。
在部署方面,AOM 聯盟創始成員對 AV1 的部署會更加積極,海外的應用也較國內更快,海外目前 AV1 主要應用在點播 / 短視頻上,分發的目標設備主要在智能電視和移動設備上。而遲遲未有動作的蘋果,在最近的 Safari 新 beta 版本上也把 AV1 放到媒體支持 API 中。
目前我們正在與頭部流媒體公司做 AV1 編碼集成的驗證工作,在這個過程也會持續對 AV1 的畫質質量做調整優化。
LiveVideoStack:ASIC 芯片開發無論是對硬件架構設計,軟件實現或是場景優化等各項能力的要求都會非常高。镕銘微電子在這些方面具有怎樣的優勢?
Amy:確實是這樣的,從業務要求、場景適配到運維層面要求都很高。镕銘微電子(NETINT)在創業之初,就定位在可計算存儲和視頻編解碼領域,在芯片設計之初即面向云數據中心服務器端,在芯片架構層次上做了很多創新設計,全球率先采用了先進的 Computational Storage 架構,視頻編解碼通過標準的 NVMe 接口來處理,不需要私有的驅動程序。也因此實現業界最廣泛的服務器硬件以及操作系統兼容性,保證了數據中心大規模部署上線的運維穩定性。
從軟件實現上,我們從 Logan 這一代芯片 2019 年量產發布后,持續與頭部互聯網客戶協同進行集成功能開發,并且做了大量音視頻碼流的兼容性工作, 僅在測試場景的積累上已超過 5 萬 + 用例覆蓋,也幫助我們自己深刻理解客戶應用場景。大家看我們的芯片規格也知道我們的重點之一是編解碼。我們在編解碼算法方面有很深的積累,通過服務全球的頭部客戶在應用領域積累了大量的經驗,這些都體現在我們的硬件和軟件系統中,得到客戶的認可和信賴。
LiveVideoStack:當前,許多互聯網廠商已經開始紛紛發力走上芯片自研的道路。對此,您如何看待?
Amy:數據中心計算最密集的應用程序就是視頻,視頻編解碼更是如此,非常適合采用專用集成電路 ASIC 來完成。頭部互聯網廠商本身有巨大的視頻流量,部分客戶投入自研說明頭部客戶對 VPU 市場需求和解決方案的高度認可。但術業有專攻,互聯網公司和芯片公司各有自己擅長的領域,預計未來 VPU 市場會形成頭部自研客戶和專業 VPU 芯片公司某種程度合作的局面。
另外,芯片的競爭也是生態體系的競爭,場景越豐富、用量越大、兼容的服務器廠商和操作系統越多,生態會更健全,也更理解海量客戶的場景。镕銘微電子 VPU 作為一直深耕這個領域的領軍者和專業廠商,我們也在不斷地創新和優化,努力提供更加適用于不同場景、更加可靠的解決方案,成為客戶可信賴的合作伙伴。
LiveVideoStack:對于未來下一代硬件視頻編解碼方案,在技術創新以及場景應用等方面,有哪些值得期待的可能?
Amy:對于下一代產品,向大家透露一些值得期待的方向。一方面是畫質,片上的專用處理芯片將會把 AI 與視頻編碼結合,將原來 GPU 才能完成的畫質增強、超分超幀能力、畫質質量探測以更高效、更低的成本實現規模化應用;第二方面,對新的視頻編碼標準的支持也在產品規劃內;第三方面是應用場景的適配,也將是未來的重點工作,包括互動娛樂場景、云渲染編碼、云桌面場景、視頻會議場景、OTT 場景等都是值得期待的場景。
LiveVideoStack:接下來 LiveVideoStackCon 2022 北京站 大會現場您還會帶來怎樣的精彩分享?可否提前跟大家劇透下,有哪些關鍵內容是值得關注的?
Amy:本次會議我將重點介紹镕銘微電子 VPU 如何幫助客戶實現極致增效降 "本",在媒體計算上為客戶實現 20-40 倍 TCO 成本下降,并提供穩健的運維方法、全面的服務器和內核兼容、免驅動適配能力,在運維層面保障在大規模數據中心的順利落地,這些與镕銘微電子 VPU 的軟硬件設計密切相關,我本次會對此做重點分享。同時,我將介紹基于新一代 Quadra VPU 的全球首個硬件智能極速高清產品,如何將歷來成本高企的 AI 增強視頻產品帶入到規模應用中。歡迎大家前來會場一起探討。
LiveVideoStack:好的,感謝您接受采訪,期待您在大會上的精彩分享。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司