不久前,我们收到一条公开点赞——
香港立法会主席梁君彦在社交平台发文点赞的“智识听”系统,是香港立法会与科大讯飞联合打造的智慧誊录系统。
“智识听”深度适配立法会场景的实时字幕功能,运用科大讯飞中英粤混读引擎,结合声纹识别和字幕与帧画面对齐压制技术,实现会议直播中文字和视频画面的同轨显示,公众可通过实时字幕无障碍获取政策资讯,沉浸见证民主议政的全过程。
今天给大家分享一下,这背后的故事。
香港立法会来了一位AI字幕君
香港立法会是中华人民共和国香港特别行政区的立法机关,根据 《中华人民共和国香港特别行政区基本法》设立,负责制定、修改和废除法律,并监督政府工作。
第七届立法会由90名议员组成,立法会在会期內通常逢星期三上午11时在立法会综合大楼会议厅举行会议,议员及官员可用普通话、粵语或英语发言,会议席上提供即时传译服务,并向公众直播。
同时,立法会会议的过程会逐字记录,一般被称为议事录,在立法会结束后向公众发放。
以往,立法会一场会议从召开到向公众发放议事录大概需要7个工作日,信息发布稍显滞后。
2022年,梁君彦得知科大讯飞作为内地人工智能领域的头部企业,自2021年起开始承担全国人大会议的相关语音转写工作,平均准确率高达96%。他召集立法会的同事,经过数次交流考察,与科大讯飞达成了合作计划。
“智识听”深度学习2.5亿字语料、400小时音频、20万条香港特色关键词,口音、新地名、混语发言实时适配,即使面对议员特殊口音或复杂地名也能高效处理。
目前,实时字幕的准确率达96%,通过幕后同事的即时修正,准确率通过人机结合可达99%。
“智识听”实时字幕准确输出
除了90名议员之外,立法会综合大楼内还有议员办事处职员和立法会秘书处职员等也要深度使用“智识听”,约有1000名使用者。同时,立法会会议通过各种渠道向公众直播,为数百万香港民众服务。
从此,香港朋友们都可以通过这位“AI字幕君”,及时见证立法会全过程了。这标志着香港立法公开透明化迈出关键一步,也为粤港澳大湾区数字政务建设树立了新标杆。
实时字幕更准了
议事录发放更快了
“智识听”正式调研、研发、上线历时近三年,从1.0版本的录音转文字到2.0版本的实时转文字,再到3.0版本的实时字幕,背后是合作双方的共同努力。
“智识听”项目初始,粤语的识别率不太高。
一是因为立法会议员使用的粤语俚语和法律专业术语较多; 二是因为部分议员的粤语有口音,既有老香港口音,也有广东等各地方言口音; 三是大家的语言习惯是中英粤混杂,导致机器识别率降低。
怎么办?为了解决这一问题,立法会秘书处整理了2.5亿汉字的中英文对照和20万个高频粤语词汇,将其作为语料库提供给机器学习。经过数据和算法的优化和不断的训练,立法会会议实时字幕的准确率达96%。
会议的逐字记录效率也因此项技术的落地大幅提升。原先,需要7个工作日才能发布的议事录,会议召开后第二天即可发布。
梁君彦多次在社交媒体推介“智识听”系统,并在采访中表示要将其推荐给英联邦国家。他说:“科技是时代的高铁,你如果上不去,就会被社会的发展抛下。这几年,内地在人工智能领域的发展日新月异,香港也不能掉队,要积极与内地科技企业合作,推动立法会智慧化转型。”
智识听的背后是“实战”经验丰富的讯飞听见多语种会议系统。
科大讯飞项目经理张坤介绍:讯飞听见多语种会议系统,已服务全国人民代表大会4年,服务中国人民政治协商会议7年。
在2025年的十四届全国人大三次会议上,提供了160套智慧简报系统,服务34个代表团,完成1290小时会议记录和转写1875万字,识别率96.2%;在全国政协十四届三次会议上,提供了60套智慧简报系统,支撑372场分组会议,覆盖58个界别。
张坤透露,目前智识听四期正在准备中,该期将建设英语字幕和多语种字幕系统。同时,基于星火大模型的进步,香港立法会的智慧办公系统也提上日程。
香港作为科大讯飞国际化战略的重要桥头堡,是多语言场景的最佳试验场。科大讯飞在港将有越来越多的AI应用,助力打破语言壁垒,助力世界沟通!
-
AI
+关注
关注
88文章
35750浏览量
282396 -
科大讯飞
+关注
关注
19文章
844浏览量
62616
原文标题:香港立法会来了一位AI字幕君
文章出处:【微信号:iFLYTEK1999,微信公众号:科大讯飞】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
科大讯飞亮相第137届广交会
科大讯飞深度解析DeepSeek-V3/R1推理系统成本

评论