8月17-21日,國際音頻領(lǐng)域頂級(jí)會(huì)議INTERSPEECH在荷蘭鹿特丹舉辦。榮耀聯(lián)合上海交通大學(xué)完成的兩篇聚焦端側(cè)多語種任務(wù)的研究成果成功入選INTERSPEECH2025錄用論文,并受邀在會(huì)議上作技術(shù)發(fā)表。作為全球語音科學(xué)與技術(shù)領(lǐng)域最具權(quán)威性的學(xué)術(shù)會(huì)議之一,INTERSPEECH的認(rèn)可體現(xiàn)了榮耀在端側(cè)AI語音技術(shù)領(lǐng)域的持續(xù)努力與技術(shù)積累,這表明榮耀在全球化的AI技術(shù)交流中,取得了一定進(jìn)展。在阿爾法戰(zhàn)略的指引下,榮耀于AI領(lǐng)域持續(xù)深耕,此次取得的成果,是榮耀技術(shù)探索道路上的一個(gè)重要里程碑,標(biāo)志著榮耀在AI領(lǐng)域的實(shí)踐與理解邁上了一個(gè)新臺(tái)階。
雙論文入選國際頂會(huì),端側(cè)AI語音技術(shù)獲權(quán)威學(xué)術(shù)認(rèn)可
INTERSPEECH作為國際音頻領(lǐng)域頂級(jí)會(huì)議,其收錄論文代表著全球語音技術(shù)研究的最前沿方向。榮耀的兩篇論文成功入選,聚焦的正是當(dāng)前端側(cè)AI語音技術(shù)的核心難題——如何在移動(dòng)設(shè)備有限的算力與存儲(chǔ)資源下,實(shí)現(xiàn)媲美云端的多語種實(shí)時(shí)語音識(shí)別與通話翻譯體驗(yàn)。
(圖:榮耀兩位AI專家在荷蘭鹿特丹INTERSPEECH學(xué)術(shù)交流現(xiàn)場作技術(shù)發(fā)表)
據(jù)了解,榮耀研發(fā)團(tuán)隊(duì)與上海交通大學(xué)的聯(lián)合攻關(guān),針對“端側(cè)實(shí)現(xiàn)高準(zhǔn)確率、高響應(yīng)速度翻譯體驗(yàn)”的技術(shù)痛點(diǎn)提出獨(dú)創(chuàng)性解決方案,相關(guān)技術(shù)已成功轉(zhuǎn)化為可落地的端側(cè)多語種通話翻譯功能,實(shí)現(xiàn)了從學(xué)術(shù)研究到產(chǎn)業(yè)應(yīng)用的無縫銜接。
榮耀MagicOS副總裁孫建發(fā)表示:“榮耀始終堅(jiān)信,AI 技術(shù)的終極價(jià)值在于更好地服務(wù)用戶,而端側(cè)AI 是實(shí)現(xiàn)隱私安全與極致體驗(yàn)平衡的最優(yōu)路徑。此次研究成果入選 INTERSPEECH,是對榮耀技術(shù)創(chuàng)新的鼓勵(lì),同樣印證了‘從用戶需求出發(fā)’的研發(fā)理念,讓每位用戶在無網(wǎng)絡(luò)環(huán)境下也能享受精準(zhǔn)、實(shí)時(shí)的多語種翻譯,這才是端側(cè) AI 真正的普惠價(jià)值。”
突破行業(yè)兩難瓶頸,構(gòu)建全球首個(gè)端側(cè)語音大模型
在移動(dòng)互聯(lián)網(wǎng)時(shí)代,語音已成為人機(jī)交互的核心入口,而端側(cè)語音技術(shù)的突破直接關(guān)系到用戶體驗(yàn)。長期以來,行業(yè)面臨著兩難困境:依賴云端處理的語音翻譯方案存在隱私泄露風(fēng)險(xiǎn),而傳統(tǒng)端側(cè)方案又受限于設(shè)備算力,難以實(shí)現(xiàn)實(shí)時(shí)性與準(zhǔn)確性的兼顧。
榮耀的研究項(xiàng)目啟動(dòng)之初就確立了“純端側(cè)實(shí)現(xiàn)媲美云端的通話翻譯體驗(yàn)”的目標(biāo),這意味著研發(fā)團(tuán)隊(duì)必須在算力、存儲(chǔ)、功耗多重約束下,解決兩大核心挑戰(zhàn):一是如何讓AI在極短時(shí)間內(nèi)精準(zhǔn)識(shí)詞,實(shí)現(xiàn)低延遲與高準(zhǔn)確率的平衡;二是如何在有限資源下保證翻譯響應(yīng)的流暢性與實(shí)時(shí)性。
經(jīng)過多次技術(shù)迭代,榮耀團(tuán)隊(duì)創(chuàng)造性地提出兩大技術(shù)方案:其一,通過創(chuàng)新的注意力機(jī)制與決策策略結(jié)合,讓端側(cè)AI實(shí)現(xiàn)流式語音識(shí)別能力,無需等待用戶說完整句話即可啟動(dòng)識(shí)別與翻譯,徹底打破傳統(tǒng)方案的延遲瓶頸,真正做到“邊說邊識(shí)別”;其二,提出全新的投機(jī)采樣推理模塊,通過直接與主模型的“大腦”協(xié)同工作,即時(shí)讀取并利用主模型已經(jīng)形成的“記憶”和“思路”來高效預(yù)測接下來可能出現(xiàn)的詞,在不降低準(zhǔn)確性的前提下實(shí)現(xiàn)推理速度的顯著提升。
這兩項(xiàng)技術(shù)方案不僅通過了權(quán)威學(xué)術(shù)評審,同時(shí)在實(shí)測中展現(xiàn)出強(qiáng)大性能:將傳統(tǒng)方案3-4GB的內(nèi)存占用壓縮至800MB,節(jié)省75%存儲(chǔ)空間;翻譯準(zhǔn)確率提升16%,推理速度提升38%,真正實(shí)現(xiàn)了“小而美”的突破。
依托這些技術(shù)創(chuàng)新,榮耀成功構(gòu)建起全球首個(gè)端側(cè)語音大模型,將中、英、德、法、西、意等6個(gè)語種包嵌入僅0.8B參數(shù)量的模型中,用戶無需額外下載語音包即可實(shí)現(xiàn)多語種互譯,且支持離線使用——這意味著即便在無網(wǎng)絡(luò)環(huán)境下,語音數(shù)據(jù)也能在本地完成處理,從源頭保障隱私安全。
阿爾法戰(zhàn)略持續(xù)落地,榮耀AI技術(shù)矩陣構(gòu)建全生態(tài)體系
榮耀在端側(cè)AI語音技術(shù)領(lǐng)域的突破,并非偶然,而是品牌長期深耕AI戰(zhàn)略的必然結(jié)果。自阿爾法戰(zhàn)略公布以來,榮耀在AI技術(shù)領(lǐng)域的投入始終保持“持續(xù)性”與“前瞻性”,從AI體驗(yàn)落地到技術(shù)開源,再到端側(cè)語音大模型突破,形成了清晰的戰(zhàn)略演進(jìn)路徑。
此前,在世界人工智能大會(huì)(WAIC)期間,榮耀正式發(fā)布自研多模態(tài)感知大模型——MagicGUI大模型。作為榮耀推出的首個(gè)GUI開源大模型,MagicGUI以7B(70億)參數(shù)規(guī)模,支撐底層AI智能體的多模態(tài)感知與自動(dòng)執(zhí)行規(guī)劃能力,比肩SOTA模型達(dá)到行業(yè)領(lǐng)先水平。
榮耀開源的MagicGUI大模型意圖識(shí)別技術(shù),已在人機(jī)交互領(lǐng)域樹立新標(biāo)桿,通過精準(zhǔn)理解用戶指令背后的真實(shí)需求,讓智能設(shè)備從“被動(dòng)響應(yīng)”轉(zhuǎn)向“主動(dòng)服務(wù)”。而此次端側(cè)語音大模型的落地,則進(jìn)一步完善了榮耀AI技術(shù)矩陣,構(gòu)建全面的AI生態(tài)體系,為榮耀MagicOS用戶帶來更優(yōu)質(zhì)的AI體驗(yàn)。
技術(shù)落地賦能產(chǎn)品與行業(yè),榮耀AI 領(lǐng)導(dǎo)力走向全球
隨著兩篇論文在INTERSPEECH會(huì)議上正式發(fā)表,榮耀端側(cè)AI語音技術(shù)迎來廣泛的行業(yè)關(guān)注。據(jù)透露,相關(guān)技術(shù)已率先應(yīng)用于榮耀最新旗艦產(chǎn)品,未來還將擴(kuò)展至更多語種與場景,進(jìn)一步提升全球化服務(wù)能力。
從更深層次來看,此次技術(shù)突破不僅是榮耀的個(gè)體成就,也代表著中國科技企業(yè)在全球AI競爭中的崛起。在語音識(shí)別等領(lǐng)域,榮耀通過獨(dú)創(chuàng)技術(shù)創(chuàng)新,彰顯了AI科技的硬實(shí)力。INTERSPEECH的認(rèn)可,無疑將為榮耀打開更廣闊的國際合作空間,推動(dòng)榮耀AI技術(shù)標(biāo)準(zhǔn)與方案走向世界。
對于消費(fèi)者而言,榮耀在AI領(lǐng)域的持續(xù)突破意味著更優(yōu)質(zhì)、更安全、更智能的產(chǎn)品體驗(yàn)。從MagicGUI大模型的意圖識(shí)別與自動(dòng)化執(zhí)行,到端側(cè)語音大模型的離線、實(shí)時(shí)翻譯,榮耀正用技術(shù)創(chuàng)新重新定義智能終端的核心價(jià)值——不再是硬件參數(shù)的堆砌,而是以AI為核心的“感知能力”“理解能力”與“服務(wù)能力”的綜合提升。
從阿爾法戰(zhàn)略的藍(lán)圖繪就,到MagicGUI大模型的開源共享,再到端側(cè)語音大模型的全球首發(fā),榮耀用持續(xù)不斷的技術(shù)突破證明:真正的AI領(lǐng)導(dǎo)力,源于對用戶需求的深刻洞察,源于對技術(shù)創(chuàng)新的執(zhí)著追求,更源于構(gòu)建開放生態(tài)、推動(dòng)行業(yè)進(jìn)步的責(zé)任擔(dān)當(dāng)。未來,隨著更多AI技術(shù)的落地,榮耀將為消費(fèi)者帶來更智能的生活體驗(yàn),為中國科技在全球舞臺(tái)上贏得更多掌聲。
關(guān)于CNMO | 聯(lián)系我們 | 站點(diǎn)地圖 | 精英招聘 | CNMO記事 | 家長監(jiān)護(hù)工程 | 舉報(bào)不良信息
Copyright © 2007 -
北京沃德斯瑪特網(wǎng)絡(luò)科技有限責(zé)任公司.All rights reserved 發(fā)郵件給我們
京ICP證-070681號(hào) 京ICP備09081256號(hào) 京公網(wǎng)安備 11010502036320號(hào)