隐私与感受双优 荣耀端侧AI语音技术凭革新成果入选INTERSPEECH
时间:2025-08-23 14:09:11 出处:企业阅读(143)
8月17-21日,国际音频领域顶尖会议INTERSPEECH在荷兰鹿特丹举办。荣耀联合上海交通大学完成的两篇聚焦端侧多语种任务的探讨成果胜利入选INTERSPEECH2025录用论文,并受邀在会议上作技术发表。当做全球语音科学与技术领域最具权威性的学术会议之一,INTERSPEECH的认可体现了荣耀在端侧AI语音技术领域的持久尽力与技术积累,这表明荣耀在全球化的AI技术沟通中,获取了必定进展。在阿尔法战略的指引下,荣耀于AI领域持久深耕,此次获取的成果,是荣耀技术探索道路上的一个关键里程碑,标志着荣耀在AI领域的实践与领会迈上了一个新台阶。
双论文入选国际顶会,端侧AI语音技术获权威学术认可
INTERSPEECH当做国际音频领域顶尖会议,其收录论文代表着全球语音技术探讨的最前沿方向。荣耀的两篇论文胜利入选,聚焦的正是当前端侧AI语音技术的核心难题——怎样在移动设备有限的算力与存储资产下,达成媲美云端的多语种实时语音识别与通话翻译感受。
(图:荣耀两位AI专家在荷兰鹿特丹INTERSPEECH学术沟通现场作技术发表)
据熟悉,荣耀研发团队与上海交通大学的联合攻关,针对“端侧达成高准确率、高响应速率翻译感受”的技术痛点提出独创性办理方案,相干技术已胜利转化为可落地的端侧多语种通话翻译功能,达成了从学术探讨到产业应用的无缝衔接。
荣耀MagicOS副总裁孙建发表示:“荣耀始终坚信,AI 技术的终极价值在于更好地业务顾客,而端侧AI 是达成隐私保证与极致感受平衡的最优路径。此次探讨成果入选 INTERSPEECH,是对荣耀技术革新的鼓励,同样印证了‘从顾客需求出发’的研发理念,让每位顾客在无互联网环境下也能享受精准、实时的多语种翻译,这才是端侧 AI 确实的普惠价值。”
突破产业两难瓶颈,构建全球首个端侧语音大模型
在移动互联网时代,语音已变成人机交互的核心入口,而端侧语音技术的突破径直关系到顾客感受。长期以来,产业面对着两难困境:依赖云端处置的语音翻译方案现存隐私泄露危机,而常规端侧方案又受限于设备算力,难以达成实时性与准确性的兼顾。
荣耀的探讨工程开启之初就确立了“纯端侧达成媲美云端的通话翻译感受”的目的,这意味着研发团队务必在算力、存储、功耗多重约束下,办理两大核心挑战:一是怎样让AI在极短时间内精准识词,达成低延迟与高准确率的平衡;二是怎样在有限资产下确保翻译响应的流畅性与实时性。
经过多次技术迭代,荣耀团队创造性地提出两大技术方案:其一,经过革新的注意力机制与决策策略结合,让端侧AI达成流式语音识别实力,无需等候顾客说完整句话即可开启识别与翻译,彻底打破常规方案的延迟瓶颈,确实做到“边说边识别”;其二,提出全新的投机采样推理模块,经过径直与主模型的“大脑”协同工作,即时读取并运用主模型曾经构成的“记忆”和“思路”来高效预测接下来或许呈现的词,在不减少准确性的前提下达成推理速率的显著提升。
这两项技术方案不但经过了权威学术评审,与此同时在实测中展现出强大性能:将常规方案3-4GB的内存占用压缩至800MB,节省75%存储空间;翻译准确率提升16%,推理速率提升38%,确实达成了“小而美”的突破。
依托那些技术革新,荣耀胜利构建起全球首个端侧语音大模型,将中、英、德、法、西、意等6个语种包嵌入仅0.8B参数量的模型中,顾客无需额外下载语音包即可达成多语种互译,且支撑离线应用——这意味着即便在无互联网环境下,语音数字也能在本地完成处置,从源头保证隐私保证。
阿尔法战略持久落地,荣耀AI技术矩阵构建全生态体系
荣耀在端侧AI语音技术领域的突破,并非偶然,而是品牌长期深耕AI战略的必然结局。自阿尔法战略发布以来,荣耀在AI技术领域的投入始终保持“持久性”与“前瞻性”,从AI感受落地到技术开源,再到端侧语音大模型突破,构成了清晰的战略演进路径。
此前,在世界人工智能大会(WAIC)期间,荣耀正式发布自研多模态感知大模型——MagicGUI大模型。当做荣耀推出的首个GUI开源大模型,MagicGUI以7B(70亿)参数规模,支撑底层AI智能体的多模态感知与自动实施规划实力,比肩SOTA模型达成产业领先程度。
荣耀开源的MagicGUI大模型意图识别技术,已在人机交互领域树立新标杆,经过精准领会顾客指令背后的真实需求,让智能设备从“被动响应”转向“主动业务”。而此次端侧语音大模型的落地,则进一步健全了荣耀AI技术矩阵,构建全面的AI生态体系,为荣耀MagicOS顾客带来更优质的AI感受。
技术落地赋能产品与产业,荣耀AI 带领力走向全球
伴随两篇论文在INTERSPEECH会议上正式发表,荣耀端侧AI语音技术迎来广泛的产业重视。据透露,相干技术已率先应用于荣耀最新旗舰产品,将来还将扩展至更多语种与场景,进一步提升全球化业务实力。
从更深层次来看,此次技术突破不但是荣耀的个体成就,也代表着我国科技公司在全球AI角逐中的崛起。在语音识别等领域,荣耀经过独创技术革新,彰显了AI科技的硬实力。INTERSPEECH的认可,无疑将为荣耀打开更广阔的国际协作空间,促进荣耀AI技术标准与方案走向世界。
关于花费者而言,荣耀在AI领域的持久突破意味着更优质、更保证、更智能的产品感受。从MagicGUI大模型的意图识别与自动化实施,到端侧语音大模型的离线、实时翻译,荣耀正用技术革新重新界定智能终端的核心价值——不再是硬件参数的堆砌,而是以AI为核心的“感知实力”“领会实力”与“业务实力”的综合提升。
从阿尔法战略的蓝图绘就,到MagicGUI大模型的开源共享,再到端侧语音大模型的全球首发,荣耀用持久持久的技术突破证明:确实的AI带领力,源于对顾客需求的深刻洞察,源于对技术革新的执着追求,更源于构建开放生态、促进产业进步的责任担当。将来,伴随更多AI技术的落地,荣耀将为花费者带来更智能的生存感受,为我国科技在全球舞台上赢得更多掌声。