GSMA联合产业界发布AI Calling原生应用体验规范
在2026年巴塞罗那通信展期间,在由GSMA主办的5G Futures Summit上,GSMA联合华为、e&、TIM、中国电信、Nokia等产业伙伴共同发布了《Gigauplink, Deterministic Latency, and Network Evolution for the Mobile AI Era》白皮书。白皮书定义了面向移动AI时代运营商原生话音业务的发展演进趋势、应用场景和商业模式,并详细阐述了AI Calling体验评估规范,帮助运营商实现话音体验建网,助力用户话音业务的体验跃升。
白皮书指出,在5G-A与AI的协同驱动下,移动通信进入到了移动AI时代,运营商的原生话音业务已从传统话音演进到AI智能话音。如今,在原生IMS话音网络基础能力之上叠加AI算法和算力,传统的语音通话正在向增强型服务和创新应用演进,为用户带来稳定、高清、可视、智能、高效的下一代通话体验。这其中包括AI沉浸式通话、AI交互式通话等应用方向,这些新的AI通话服务对网络连接能力和AI能力都提出了新的要求。
在白皮书中提到,AI降噪是AI沉浸式通话中的典型应用,通过AI算法消除不同场景下的环境噪音,使运营商的原生通话服务更加清晰,为用户提供更加沉浸式的体验。AI降噪算法可应用于办公(>40分贝)、街道(>60分贝)和施工(>80分贝)等多种场景,使用户无需依赖终端设备即可享受高质量的语音服务。AI增强的实时翻译是交互式通话的典型场景,得益于话音网络能力的增强,长期存在的语言障碍正在被打破。现在,通过AI Calling可以在视频通话中提供准确实时的语音转录或翻译,这对于参与国际在线会议的商务人士、前往异国旅行的游客或听力障碍人士来说,具有非常大的价值。
在商业模式方面,白皮书提到运营商可以通过嵌入AI能力,为传统原生语音服务注入新功能新活力。用户通过支付订阅费用,即可在标准通话中享受AI驱动的增强功能,使运营商从单一的流量变现转向多维度的体验变现。
AI Calling体验评估模型规范
在AI Calling场景下,如何衡量用户体验是运营商面临的新的课题。这次白皮书系统性的定义了AI Calling的体验评估模型规范。AI Calling体验评估模型规范在传统高清话音三个体验指标维度(QoE、QoS、覆盖)的基础上,叠加了AI沉浸式体验、AI互动式体验、QoI三个新的维度。其中,沉浸式通话场景可使基础音通话体验得到跃升,如可明显感知的MOS提升、SNR增强等。交互式通话场景下网络需要提供新的交互通道和能力,如通过DC(数字通信)和VC(视频通信)能力,以实现屏幕共享、实时翻译、座席交互等增强体验。QoI是衡量话音网络智能化程度的关键指标,这包括高质量的AI模型、灵活的AI管理能力、基于AI的网络/用户状态感知与决策、普惠性AI服务能力等,是实现话音体验跃升的网络基础保障。
当前,ITU已启动一个名为P.AI-MOS的工作项目,用于评估多模态人工智能应用的用户体验,AI Calling语音体验的提案也在研究之中。基于此,GSMA协同产业界呼吁共同推动体验评测模型的发展,建立AI应用关键质量指标(KQI)与网络关键性能指标(KPI)之间的映射规则,加速移动AI业务体验与评测标准的落地,从而更好地支撑移动AI产业的发展。