Chinese-LiPS 是由智源研究院联合南开大学于 2025 年发布的一个多模态语音识别数据集,相关论文成果为:「Chinese-LiPS: A Chinese audio-visual speech recognition dataset with Lip-reading and Presentation Slides」作为首个「唇读信息+幻灯片语义信息」结合的中文多模态语音识别数据集,Chinese-LiPS 面向中文讲解、科普、教学、知识传播等复杂语境,致力于推动中文多模态语音识别技术的发展。


雷达卡




京公网安备 11010802022788号







