文 / 紀柏豪
一、引言
在這個由技術創新推動的時代,我們見證了人工智慧(AI)的驚人發展。AI的創意應用,不只侷限於繪畫和寫作領域,更深入到音樂——一種能觸動靈魂的藝術形式。在AI的音樂世界裡,從旋律生成到音色轉換,我們看到了其無限潛力。然而,大多數AI音樂應用似乎都偏愛西方音樂。那麼,對於蘊含深厚文化和情感的東方音樂,AI又能發揮怎樣的作用呢?本身有多年二胡演奏經驗的施國琛教授,與來自國樂、影像、工程等不同專業背景的學者團隊,在「以人工智慧實踐二胡演奏行為暨音樂風格分析」這一整合型計畫(以下簡稱「此計畫」)中,展現了將國樂結合科技應用的開拓精神,以音樂風格分析與生成、演奏行為影像分析、音樂視覺化表現等多個子計劃,涵蓋從技術到藝術的多元面向,在傳統與現代之間架起溝通橋樑。本文將就研究團隊所提供的計畫資料與執行成果,輔以訪談內容與個人經驗,討論二胡這樣歷史悠久的國樂器如何在AI的幫助下揚帆遠航。
二、古樂新聲——技術革新與文化挑戰
二胡,作為國樂的重要組成部分,不僅承載著數百年的文化遺產,也在現代音樂領域中展現了其不斷進化的面貌。這種進化不僅體現在工藝和技巧上的創新,也反映在音樂風格的多樣性上。當代二胡演奏家不再拘泥於傳統的中國音樂風格,而是積極地與各類音樂形式如西洋古典音樂和爵士樂等進行融合,從而豐富了二胡的表現力並擴大受眾範圍。為了更好地與西洋樂器協作,二胡在音準和調律方面也進行了必要調整,以增強其在國際舞台上的普適性。
當二胡的這種現代化進程與AI工具相遇時,我們可以這樣看待:二胡的傳統魅力源於其深厚的歷史和文化底蘊,而現代化則體現在技術和演奏風格的革新上。應用AI技術的目的並非在於取代音樂家,而是為了讓經典能與時俱進,同時拓寬音樂創作的多樣性,使這種傳統樂器邁入新時代。
在探索二胡與AI結合的過程中,研究團隊面臨了與國際上如Google的Magenta和Sony的Flow Machines等主流AI音樂專案有所不同的挑戰。雖然這些全球性專案在AI音樂領域展現了風格模仿與廣泛應用,但在處理特定風格的器樂曲時,還需要更具針對性和地域特色的分析和訓練。因此,研究團隊無法僅依賴AI音樂研究當前流行的工具和流程來處理二胡曲目及演奏資料,而是需因地制宜地開發適應二胡特有風格和技巧的專屬解決方案。此外,運用AI技術有時可能被視為對傳統的挑戰。在這種背景下,不同領域專家間的持續溝通變得尤為重要。找到能被廣泛接受的方案,既尊重傳統又擁抱創新,以個人觀點來看,反而是在技術突破之外,更值得相關研究者參考學習的一大亮點。
(Magenta是Google Brain團隊開發的研究項目,使用深度學習和強化學習等技術來生成音樂和藝術作品,並致力於創建新的工具和模型,使音樂家能利用AI技術進行創作。Flow Machines是索尼計算機科學實驗室(Sony CSL)開發的項目,專注於使用AI技術創造多樣化音樂作品,包括模仿不同藝術家風格。)
此計畫在其成果網頁上,發佈了二胡音樂自動生成系統和二胡基礎訓練及教學平台,展示AI技術在傳統樂器教學和創作上的應用,也揭示了如何在保留傳統二胡音樂魅力的同時,應用新興科技實現文化傳承與創新。以下將分別介紹此計畫主要成果,探討它們如何在傳統與現代之間建立新的聯繫。
三、AI與國樂的數位化躍遷
團隊所開發的二胡音樂自動生成系統,展示了從民歌、戲曲到器樂素材中抓取音樂特徵,整合機器學習演算法來生成具有特定風格 ( 在此研究中,為「江南」與「秦派」風格。)的二胡音樂的可能性。此研究的關鍵挑戰之一,在於使AI生成的音樂不僅規格上正確,還要能傳達二胡音樂深沉的文化內涵。例如,江南音樂以其細膩、流暢、含蓄的特點著稱,AI若要捕捉這種獨特風格的情感和美學,除了要理解音樂的節奏和旋律,還要量化那些非明文規定,卻對音樂表現至關重要的細微之處。AI模型,尤其是深度學習模型的有效訓練,依賴於大量高質量、具代表性的數據。然而,在二胡音樂領域,這樣的數據相對難以獲得。因此,模型的過度擬合成為一個顯著的問題,特別是當數據集有限或偏向特定風格時。這可能限制模型的學習或泛化能力。
在這種情境下,此計畫採取了一種獨特方法來應對過度擬合(overfit)的問題,並將此現象視為一種形塑風格的機會。在訪談中,團隊解釋了此生成系統的大致流程:首先應用馬可夫鏈對上百首二胡曲目進行分析與生成,創造出大量相似但不相同的樂句。這對有限樣本的數據集是一種有效的擴充策略。然而,馬可夫鏈雖然能模擬旋律線條,但在理解曲子結構如起承轉合等層面仍有所不足。在此基礎上,透過對這些樂句進行深度學習模型訓練,團隊嘗試讓AI理解音樂更深層次的結構並使所生成的音樂段落銜接更為流暢。
為了更具體地展示這一系統的創作能力,團隊創造了多種曲目,用於練習和演奏,並發表了三首完整的、具有風格特點的由AI創作的二胡曲目。目前,研究團隊已成功地運用符號音樂生成(Symbolic-domain)方法來創作樂譜和旋律,這在提供基礎訓練材料和創作靈感方面已經展現了其價值。但最終,AI生成的曲目要轉化為實際的二胡樂譜時,仍須專業音樂家進行手動編修及演繹,以提高其表達的準確性和深度。這表明,儘管AI在音樂創作中的潛力巨大,但人工智慧與人類藝術家之間的協作和互補關係仍然至關重要。
(包含強化學習(Reinforcement Learning)、變換器(Transformer)模型、生成對抗網路(GAN)等深度學習技術,並運用馬可夫鏈(Markov Chian)和退火式演算法(Simulated Annealing Algorithm)等進行符號音樂的生成及優化。)
在探索此計畫所開發的「二胡音樂自動生成系統」網頁平台時,其便利性和創新性成為顯著特點。該平台的二胡音樂自動生成系統,允許用戶迅速選擇配器、速度和風格,並能產生相應的樂譜。這一功能,不僅方便易用,還通過MIDI音色提供了基礎的音樂示意,為使用者打開了一扇音樂創作的門。
然而,在當前音樂AI技術的迅速發展中,特別是在音色生成和頻域分析等方面的進步,為音樂創作提供了更深層次的表現能力。諸如擴散模型和文字轉音樂技術,正在改變我們創造和體驗音樂的方式,使生成的音樂能帶有真實的音色質地與表情。與傳統的符號音樂生成方法相比,這些新技術提供了更豐富、更生動的音樂創作體驗。未來若能將這些新興技術融入二胡AI音樂研究,意味著在音色和表情層面上的顯著創新。例如,頻域分析可以更細膩地捕捉二胡的獨特音色特徵,例如不同地區的二胡音色差異等,從而在AI生成的作品中呈現出更加豐富和真實的聲音。
目前團隊所展示的「二胡音樂自動生成系統」,毋庸置疑地可為音樂家提供新的靈感和創作視野。然而,雖然在創作速度和方便性上雖有所提升,但若要達到專業作曲水準,仍需進一步的編輯和改進。AI在生成創意構思或旋律變化上的作用,提供的是創作的出發點,後續人為的細緻調整和創意介入仍是必不可少的。這引出了一個引人入勝的問題:AI是否能成為真正的創意夥伴,達到超越人類音樂家的創作水平?這是否是我們所需要的AI音樂工具?
四、教學應用的創新與挑戰
在AI二胡教學的實踐中,研究團隊結合現有的二胡演奏風格與AI技術,開發了二胡基礎訓練及教學平台。這一系統透過影像辨識和音訊分析,能夠精確地分析學生的演奏姿勢與手勢,並提供與專業標準的即時比較及反饋,幫助學生識別和改進演奏技巧。。這不僅提升了教學效率,也為學生創造了一種新穎的學習體驗,激發他們的學習動機。
分項主持人孫沛立教授及團隊通過融合傳統影像處理技術與深度學習方法,進一步提高了對二胡演奏技巧的分析精度。這種結合豐富且細緻的數據集進行的分析,為模型的訓練和優化提供了堅實的基礎。然而,這種技術進展同時也帶來了新的挑戰,例如如何處理個體之間在演奏技巧和體態上的差異,以及如何使系統更直觀易用。
(擴散模型(Diffusion Model)是一種深度學習方法,通常用於生成圖像、音樂或其他類型的媒體。在音樂領域,擴散模型能夠模仿特定風格的音樂,並創造出全新的作品。它們通過逐步增加隨機噪聲至原始數據(如樂譜或音頻),然後再逐步去除這些噪聲的方式來生成輸出。這種方法尤其擅長捕捉細微的細節和風格特點,從而能產生更自然、更富有表達力的音樂作品。)
此研究在二胡特殊技法偵測方面的進展,讓我想起了2019年參與台北市立國樂團委託的《忘言歌》項目的經驗。當時,我與二胡演奏家王瀅絜以及雲樹三重奏的合作,專注於利用機器學習技術輔助二胡演奏。透過一系列的訓練和分析,我們使系統能夠辨認包括大擊弓、顿弓、顫弓等特殊技法。因為我對國樂的專精程度有限,AI比我更能識別及分辨這些獨特的演奏技法和表情。這些技巧不僅是技術上的挑戰,更是情感表達的重要媒介。在有限的數據集下,我們對這些弓法進行了識別,發現只有經驗豐富的演奏家,才能在演奏中保持弓法的動態穩定性,使系統達到一定精確度。這一經驗呼應了此計畫中教學平台採用的師生演奏對照方法,並得以想像AI技術在分析和指導二胡演奏技巧上的潛力,尤其是在處理這些特殊技法時。如果能夠結合此研究提供的跨學科資源,並讓師生共同參與後續的訓練,有望創建一個更全面的系統,不僅能支持基本技巧分析,還可識別和指導特殊的演奏表情和弓法,從而大幅提高教學效率,幫助學生更快速地掌握二胡精髓,成為初學者不可或缺的學習輔助工具。
AI二胡教學平台的開發,不僅為傳統音樂教育開啟另一扇窗,還帶了許多附加效益。例如在遠程教學方面,以新冠疫情迫使傳統教學模式轉向線上的背景為例,AI平台若能對學生的演奏提供分析和反饋,並與老師的演奏做對比,可有望提高線上學習效果。此外,偏遠地區的學生,也得以透過AI教學的應用,接觸到與城市相同水平的專業音樂教育,從而打破了地理位置限制、縮小城鄉教育資源差異。此平台相關技術在教學上的應用,也有望帶來更為個性化的學習體驗。在當今少子化導致國樂主修的學生人數減少的情況下,通過對每位學生演奏的詳細分析,提供針對性的指導和建議,可超越傳統教學模式,使學生能夠按照自己的學習節奏和需求進行學習。隨著AI技術的持續進步和優化,我們有理由期待這種技術融合會帶來更多創新的教學方法和學習工具,從而為傳統音樂教育帶來新的契機,並在藝術教育領域中創造豐富而平權的學習體驗。
五、科藝融合的反思與展望
在藝術與科技交會的歷史中,從早期控制論文化到近期蔚為風潮的AI應用,科技進程改變了藝術的創作和表現方式,也影響人們欣賞和理解藝術的觀點。此計畫中,二胡與人工智慧的結合生動體現了AI如何對傳統音樂訓練和創作方式提出挑戰。這種跨界合作不僅是技術與傳統藝術的融合,更是一種文化對話,暗示了深層的審美流變。
過去,創作像是某種少數人才有的特權。今日,隨著AI介入,人們只要點幾下滑鼠就能創造出有模有樣的曲子。由AI工具來生成音樂及指導演奏,一定程度上模糊了人與機器之間的界限,挑戰我們對「創作者」身份的傳統認知。正如馬文·明斯基(Marvin Minsky)所預示,雖然機器可能學會模仿某些音樂風格,但要創造出具有情感表達深度的音樂仍然是個巨大挑戰。近期不斷推陳出新的AI音樂應用,我們可以想見,機器最終將能夠創作出與人類作曲無異的音樂。但另一個關鍵問題是:這些音樂是否僅僅模仿人類的創造力,或者機器能否發展出自己的風格和創造力?就個人而言,科技工具應是拓展而非限縮人們的想像。期待透過AI工具的輔助,不僅能延續傳統,還能開創國樂的新面貌,無論是與不同風格融合、新型態演出,或是透過AI輔助的自動化效果和多樣表情,這是一條充滿創意和可能性的道路,也是需要耐心和堅持的探索之旅。
透過與此計畫研究團隊的交流,我們見證了二胡音樂與新科技的相互啟發和交融。過程中不同領域專家的協作,在創意的碰撞之外,也凸顯跨學科研究中溝通與整合的挑戰。展望未來,期待能有更多類似嘗試深入傳統藝術領域,開啟更多跨界創新可能性。