- +1
2023年了,你怎么還在聽老歌?|爭吵 2022
原創 翁垟 果殼
過去一年的科技熱點,你還記得哪些?是不是也曾被其中一些所吸引,甚至樂此不疲地和同好們陷入“爭吵”?
新年之初,果殼為你準備了幾個小故事,都是關于過去一年那些引起全社會熱議的技術現象,以及環繞著它們的觀點爭鳴。我們同你一起,一邊復習這些故事,一邊期待著新年的更多技術趣味。
技術不止兩面,我們的每個人的態度都彌足珍貴,“爭吵”讓它變得更加美好。
一邊在朋友圈曬年度聽歌總結,一邊抱怨“華語樂壇不行了”,這“習俗”延續多少年了?
平臺收聽榜上怎么還是周杰倫?綜藝節目里怎么還是張韶涵?KTV 里怎么還是“死了都要愛”?超市里怎么還是“恭喜你發財”?
過年指定 bgm |《恭喜發財》
最簡單暴力的回答是:新歌都不行,華語樂壇已經完蛋了!
《青年理工工作者生活研究所》研究員小凡不太信服這套說辭,作為機械設計制造及其自動化出身的一位理工科生,他想,是否能用一種基于計算的、更客觀的方式,真實地展現這些年華語音樂的變化,一舉終結這場疑問和爭吵?
抱著這個想法,他進入了一場意想不到的、為期一整年的漫長搏斗,最終,得出了一個有些超出預期的答案。
答案在聲波中飄
理想的方式是設計一套算法,教會機器給歌曲打分。好歌分高,差歌分低,再比較一下分數,一目了然。但好與壞,既抽象又主觀,想讓機器得出客觀量化的評價,就必須先在歌曲之間進行比較計算。
這意味著第一件事就是要將一首歌轉換為數字。小凡選擇的是分析一首歌的聲波。
把一首歌放到剪輯軟件里,就會看到它的波形。這個波形不僅能呈現一首歌聲音的大小,同時也包含了很多其他信息。人耳僅僅通過聽就可以輕松分辨出一首歌的歌手、風格、類型,甚至是現場還是錄音。如何讓電腦也能聽懂呢?通過深度學習。
首先,他把每首歌掐頭去尾,隨機截取 90 秒音頻,分成連續的 1800 個小段,每一段做傅立葉變換。每一個音都是由多個不同的頻率振動組合而成,在這里,傅立葉變換的作用就是把每個小段中包含的頻率分離出來,以便深度學習模型理解。
圖片來源:《青年理工工作者生活研究所》
計算后,每首歌都變成了一個 1800 列乘 3248 行的數據表格,表明這 90 秒歌曲中都包含了哪些頻率。因為數據量太大,他繼而進行了兩次壓縮,將代表每段歌曲的數據縮減到 600 個數字。
這個過程可以理解成一張圖片像素不斷降低的過程,期間信息發生了大幅的減損。為了保證圖片質量降低后你仍然能認出圖片內容,保留哪些像素,剔除哪些像素就變得很重要。
圖片來源:pixabay
小凡希望通過這 600 個數字是能“認出”這首歌的,就像識圖的深度學習模型能認出一只狗是狗,一只貓是貓。
為訓練這個模型,他收集了 1977 到 2022 年間的 5400 首流行歌曲。
這里的歌曲選擇有一個原則,就是標簽之間有交叉,“比方說 abc 三個歌手的歌里,都有 m 這個作曲家,那 a 唱的歌里面,還會找找其他人作曲的。網狀的交叉越多,就對這個模型的學習就越有好處”。
這是為了避免模型在不同標簽之間產生死板的關聯,也就是算法偏見。比如周杰倫方文山是一個很常見的搭配,這時就要多找一些方文山給別人寫的歌,來制造交叉。
深度神經網絡在輸入與輸出之間通常有多個隱藏層 |bmcblogs
接下來,他需要設置一些“正確答案”,一些能夠描述這些歌曲的標簽,歌手、作曲之外,還有年份、感情色彩、音樂類型、曲風、拍號、調式等。
學習過程簡而言之,就是讓神經網絡通過層層計算得出 600 個數字,來猜測一首歌的對應信息:是誰唱的?什么調式?猜不準就返回去重新算,直到猜中為止,循環往復 5400 次。
回到打標簽,起初,類別沒有確定,他需要邊聽邊總結。比如對于音樂類型,他就總結出純音樂、反叛、戀愛悲傷、戀愛甜蜜、魔幻、生活、耍帥、主題等八種類型。
乍一看,這似乎并不足夠細致全面,但實際上這一步并非要給歌曲提供一個十足科學的分類,“最大的目的是體現出歌之間的區分度,只要足夠讓類型不同的歌被打到不同的標簽,之間不混淆就可以了。”
定下類別后,數據標記就成了純純的體力活。小凡完全投入其中,花了兩三個星期才標注完五六百首歌,不得不對外求援,最終,雇了幾位音樂專業的學生加入這項工作,前后花費了快兩個月時間才完成。
模型經過一定學習后的“猜歌”結果|《青年理工工作者生活研究所》
“平均歌”也有春天
分類和數據標注之后,擺在小凡面前的仍是滿滿一堆數字——它們代表的意義是什么?又如何將這些數據抽絲剝繭結構起來,以回答開頭那個爭論不休的問題呢?
研究最開始,小凡想過一個“信息熵”的概念。簡單理解就是一首歌信息的復雜程度。可以設計一個程序,檢測每首歌之間是否存在重復相似,如果存在,就價值變低。
但這仍太抽象太復雜了,評判標準也不太有說服力。經歷了近半年的“亂跑亂采訪”,思路不斷碰壁,他靈光一閃,一個新的概念浮現出來:平均歌。
平均,意味著普通、不出彩、爛大街,似乎不是一個正面的評價。但在歌曲的范疇里,它卻也往往是最符合和體現大眾口味的。從計算的角度,平均歌意味著在選定范圍里,和這首歌相像的歌是最多的。
既然要計算平均,那就要先選出樣本范圍和參照系。
通過歷年的網友總結和騰訊音樂榜單,他找到了從 1998 年開始,每年最熱的 100 首歌的歌單,總共兩千多首。
這時候,就可以搬出那個復雜的深度學習模型來進行計算了。利用模型,為每首歌生成能代表它們的 600 個數字——把它們看作 600 維空間中的點,就可以了解數字和數字之間的關系,計算平均點的位置。
圖片來源:《青年理工工作者生活研究所》
由于平均點上很可能并不存在一首真實的歌,那么平均歌就是最靠近那個點的那首歌。結論是一張長長的、經過排序的歌單,從中能看到每一年的平均歌是什么。
歷年平均歌結果|《青年理工工作者生活研究所》
但這并沒有如他起初設想的一樣,驗證那個簡單粗暴的結論:華語歌越來越差了。反而,每一年的平均歌聽下來并沒有顯現出那么大的變化。
小凡跑去征求工作室音樂編輯的意見。對方回應感受:?樂隨著年代的變化中,混?的變化很明顯, 90 年代很多歌曲以合成器??為主導, 00 年代真實樂器的錄??平提?,近兩年??越來越激烈,可能和嘻哈?樂的興起有關系。
但對于平均歌,共性反而大于不同:整體平均歌都是講求明確清晰的主旋律,并且很少離調/轉調/變換基礎的節奏型。
這個結論似乎有點平淡,遠不比人們的想象。
想把“離譜歌”唱給你聽
這時,小凡被最遠離“平均”的那些數據所吸引了。歌單按照歌曲與平均點之間的距離排序,第一首是距離最近的,那么越往下便是距離越遠的歌。這些歌在各自的特定年代都是特立獨行,跟誰都不太一樣——小凡把稱它們為“離譜歌”。
右邊離散出來的點就代表著格格不入的離譜歌|數據來源:《青年理工工作者生活研究所》
離譜歌反而讓人眼前一亮。首先,它們的確顯現出相比于時代的“離譜性”,比如 1999 年位于倒數第五的《挫冰進行曲》,2004 年位于倒數第四的《波斯貓》。還有一個男人,在最活躍的十年幾乎霸榜離譜歌榜單:周杰倫。
對此,樂評人重輕表示,周杰倫的?樂在許多??背離傳統和主流的?樂語?。所以他發專輯的年份都是離譜在列,“這是最了不起的,開拓邊界的?樂?。”
整體而言,并非像許多人想象的,如今人的審美變得非常糟糕,才導致“抖音神曲”流行。反而,樂評人叨叨馮評價,“這份榜單體現出大眾的主流審美其實變化是緩慢、相對穩定的”,但如果是為了迎合?眾審美?創作,“那么寫歌快、容易成為熱歌的同時,也容易和以往的歌聽起來相似”。
對于小凡來說,近幾年的離譜歌他第一感受是“不愛聽”,“像是蹦迪的歌,不是你愿意跟著唱的歌”。從數量上看,2010 年前的離譜歌看起來似乎也更離譜一些,離譜值高的歌曲數量更多。
創新性沒有以前高,受歡迎的程度也遠不比從前,這或許就導致這些原本應當開拓邊界的離譜歌,不再像周杰倫的歌曲那樣,具備挑戰邊界、引領大眾審美的能力。
若算法回答是個錯誤,愿你我沒有白白受苦
最初啟動這個項目的時候,恰逢 2021 年末,一則視頻在網絡上被瘋狂傳閱,那是騰訊音樂發布的十大熱歌榜單。聽完網友幾乎意見一致地給出結論:華語樂壇完蛋了。
圖片來源:TMEA年度十大熱歌
小凡對于這個話題的興趣,不僅是想要驗證它,也是源于對于這個論斷的一絲懷疑。“總體上我還是比較相信,中國人也不笨,還是有很多人在寫歌,理論上應該有好歌的,但為什么好像我們見不到,聽不到?我很好奇。”
對于當前的結論,他多少感到有點遺憾,音樂沒有變得更差,但作為藝術去激發我們,帶來新奇感的能力似乎確實陷入了停滯。
但也不是所有人都認同這個結論。小凡將研究過程做成視頻發到網上,引發網友之間激烈的討論。有的網友認為,流行音樂并不等于音樂,流行音樂變成商品,變得套路化,但音樂本身仍處于無盡的創新和變化之中,只是在當前的機制下變得更難被人看到了。
也有人建議,可以把過去的“離譜歌”放到幾年后對比,看它是否仍然“離譜”。
網友評論之外,這個研究將代表一段歌曲頻率的 500 萬個數字壓縮到 600 個,勢必面臨過度簡化,信息大量丟失的問題。這 600 個數字多大程度上能代表背后的這首歌呢?小凡看來,或許是七成左右。
進一步改進,理論上他也可以打更多的標簽,讓歌曲之間區分的更明顯。目前這樣的大分類之下,兩首聽起來挺不同的兩首歌,還是有可能被打上相似的標簽——就像人臉識別,將兩個人的臉識別成一個人。
另一個遺憾是,在更正規的深度學習項目中還一定會設置交叉驗證的過程。從不同的起點,用不同路徑去算,看看能不能抵達相同的終點。這個研究中沒能設置這樣的環節。
那說到底,華語樂壇到底完沒完蛋呢?
一番大費周章之后,人們仍沒能得到一個可以一勞永逸的結論。這么做的意義或許就在于,為這個似乎無解的爭論,拓展了討論的可能性,在“回憶濾鏡”、“奶頭樂消費”之類用以互相攻擊的詞匯之外,提供了一個新的理解視角和一些新的論據。
參考文獻
[1] 騰訊視頻紀錄片《青年理工工作者生活研究所》,第14集,華語樂壇真的要不行了嗎?https://v.qq.com/x/cover/mzc00200p29k31e/r0045dm9z5v.html
[2] https://www.bmc.com/blogs/deep-neural-network/
[3] https://www.bilibili.com/video/BV1m8411P7v7/
作者:翁垟
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司