為了讓眾多以地方方言為載體的區(qū)域歷史、文化和習(xí)俗可以以短視頻的形式制作、傳播與保存,解決地方方言難以被更多用戶閱讀和理解的障礙。近期,抖音正式上線了地方方言自動翻譯功能。創(chuàng)作者可以使用該功能,“一鍵”將粵語、閩語、吳語、西南官話、中原官話等方言視頻轉(zhuǎn)化出普通話字幕,方便公眾觀看。
隨著短視頻的不斷普及,越來越多以地方方言為載體的視頻出現(xiàn)在了短視頻平臺。這些極具地方特色的視頻,一方面讓廣大用戶欣賞到了山南海北不同區(qū)域的口音與特色腔調(diào);另一方面,也因為方言識別的天然障礙,使其難以更好得被深度了解和傳播。
為此,抖音近期正式上線了地方方言自動翻譯功能。創(chuàng)作者可在抖音投稿主界面點擊“拍攝上傳投稿”,上傳視頻后,使用“自動字幕”功能,選擇“轉(zhuǎn)為普通話字幕”,新功能即可完成對視頻內(nèi)容的方言語音自動識別,并將視頻里的方言內(nèi)容轉(zhuǎn)化成普通話字幕。目前,新功能第一期已經(jīng)上線,支持粵語、閩語、吳語(上海)、西南官話(四川)、中原官話(陜西、河南)等,未來還將支持更多方言轉(zhuǎn)化。
據(jù)悉,由于各地方言常以口語形式流傳,可用于模型訓(xùn)練的方言語料數(shù)據(jù)較少,對方言識別和翻譯都提出了很大挑戰(zhàn)。對此,來自火山引擎的技術(shù)團(tuán)隊采用了自研的自監(jiān)督預(yù)訓(xùn)練模型和多語言翻譯模型,實現(xiàn)了極少量標(biāo)注數(shù)據(jù)條件下識別方言的能力,且訓(xùn)練效率提升一倍,有效有效提升了多語言翻譯的性能,同時大幅降低了模型訓(xùn)練的資源消耗。“基于日常服務(wù)抖音集團(tuán)業(yè)務(wù)的技術(shù)積累,抖音方言字幕可實現(xiàn)超低延時和高準(zhǔn)確率”,其團(tuán)隊負(fù)責(zé)人表示。
全國漢語方言學(xué)會副會長兼秘書長劉祥柏認(rèn)為,普通話是我們國家法定通用語言,普通話以漢語方言為基礎(chǔ),在形成過程中長期從方言中吸取養(yǎng)分,方言與普通話相輔相成,都是中華傳統(tǒng)文化的重要載體。“方言就像古建筑,要保護(hù)勿強(qiáng)拆”。劉祥柏表示,首先,以方言為載體的“鄉(xiāng)音”是“故鄉(xiāng)的情感符號和情感紐帶”;其次,熟練掌握方言,有利于學(xué)習(xí)、掌握古漢語,有利于把握方言與普通話的對應(yīng)規(guī)律,熟練掌握普通話;第三,漢語方言是地方文化的語言載體,“各地民歌、民謠、民諺以及快板、鼓書、說唱等,依賴于方言才能具有押韻、諧音等效果,才可以體現(xiàn)其基本的聲腔特色和地方韻味。”
抖音平臺治理相關(guān)負(fù)責(zé)人表示,將持續(xù)用技術(shù)記錄真實而美好的生活,未來會繼續(xù)升級方言自動翻譯功能,服務(wù)以方言為載體的各地文化傳播。
紅商網(wǎng)優(yōu)質(zhì)內(nèi)容還將同步分發(fā)到公眾號、視頻號、頭條號、西瓜抖音、網(wǎng)易號、搜狐號、企鵝號、百家號、好看視頻、新浪微博等國內(nèi)主力流量平臺。
|