0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AndroidQ内置实时字幕功能解读 到底有多实用

454398 ? 来源:工程师吴畏 ? 2019-05-15 09:52 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在刚刚过去的 Google I/O 2019 上,Google展示了一项名为Live Caption(实时字幕)的新功能。它内置在Android Q中,可以将手机上播放的音频实时转化为字幕,适用于播客、视频网站、语音消息、本地拍摄视频等场景。

更厉害的是,Live Caption的处理过程全部都在手机本地完成,不需要上传到云端,既保证了速度,又保证了安全。Live Caption还有哪些强大之处?这篇文章向你完整介绍。

没网也能用,在本地进行处理

字幕的重要性可能超过了很多人的想象。在一般观众眼里,它是可有可无的选项,而对于听力障碍者,字幕是他们理解内容的重要工具,Live Caption正是为他们而设计。

在此之前,Google已经在YouTube中加入了自动字幕,然而世界上还有很多没有字幕的视频内容,对于听力障碍者来说,它们就像没有声音的默剧。

能不能给手机上的所有音频添加实时字幕?这成为了Google的下一个目标。经过多个团队的努力,这个方案终于被实现出来。

不过在最初,系统需要将音频上传到云端,然后运行一个2GB的机器学习模型,过程耗时又不安全。

后来,他们在手机终端实现了相同的处理效果,并且只需要运行一个80M的模型,它可以在手机联网时自动更新,然后在没网状态下完全离线运行。

Live Caption的优势主要有三个:第一,完全在本地运行,适用于所有场景;第二,数据不会上传到云端,保证数据安全;第三,内容创作者和应用开发者不需要做任何工作,就可以让用户体验到实时字幕。

系统级的实时字幕,支持所有应用

在Google的演示中,Live Caption可以在直播、视频网站、播客、拍摄的本地视频、社交媒体、语音消息等多种场景下使用。打开方式是点击音量键,点击实时字幕按钮。

随着音频的播放,画面中央会显示动态的实时字幕,你可以调整字幕条的显示大小,拖动它们到任意位置。更神奇的,即使在静音状态下Live Caption也能正常运行。

虽然Google主要强调了Live Caption对听力障碍者的作用,但其实它对普通用户也十分有用。

在看视频的同时开启字幕,可以更好地理解内容,Google将这个功能做到了系统底层,就意味着你可以在任何视频中开启字幕。另外在会议和地铁这样的特殊场景,你可以在不开启音频的情况下理解视频内容。

今年晚些时候推出

前几天我们给大家推荐了几个「自动加字幕」的工具,视频创作者可以利用它们来减轻工作负担。

不过Google的思路显然更加彻底,他们将实时字幕做成了系统级的功能,内容创作者和应用开发者不需要做任何工作,就能让用户随时体验到实时字幕。

这个功能集成在Android Q中,一旦普及就能方便大量用户。

目前Live Caption还无法在Android Q系统中进行体验。Android团队的Brian Kemler透露,它将在今年晚些时候推出。

由于对内存和空间有要求,Live Caption会首先出现在高端的Android Q设备上,之后将支持更多设备。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Android
    +关注

    关注

    12

    文章

    3978

    浏览量

    130722
  • 谷歌
    +关注

    关注

    27

    文章

    6233

    浏览量

    108588
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HarmonyOS AI辅助编程工具(CodeGenie)代码智能解读

    功能从DevEco CodeGenie 5.1.0 Beta版本开始支持。 CodeGenie提供智能AI能力对框选的代码片段进行逐条解释,总结代码段含义,帮助开发者提升阅读代码的速度和效率
    发表于 07-17 17:02

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)

    漫画科普 | 功率放大器到底有哪些应用?带你解锁功放经典应用场景!(一)
    的头像 发表于 06-20 20:00 ?602次阅读
    漫画科普 | 功率放大器<b class='flag-5'>到底有</b>哪些应用?带你解锁功放经典应用场景!(一)

    实测 PTR54LS05低功耗到底有

    实测 PTR54LS05低功耗到底有低?
    发表于 04-27 10:57

    TLC2578芯片中FS与SDI到底有什么作用?

    ,还有就是一点不太懂的就是:TLC2578芯片中FS与SDI到底有什么作用。手册看了半天还是不懂!求解!谢谢!
    发表于 01-22 06:51

    RK3506到底有多香?抢先看核心板详细参数配置

    RK3506到底有多香?触觉智能已推出RK3506核心板,抢先了解核心板详细参数配置!
    的头像 发表于 01-18 11:33 ?2036次阅读
    RK3506<b class='flag-5'>到底有</b>多香?抢先看核心板详细参数配置

    24位或者说高分辨率的AD到底有什么用呢?

    的AD,如24位的AD,其分辨率达到很低的uV级别,我们如何考究其精度?而且AD的精度受到诸多因素的影响,其中参考源的稳定度和供电电源的稳定度对精度影响很大,参考源最低0.05%的精度,那么24位的分辨率所可以达到的精度却是要大打折扣的,请问在这样的情况下,24位或者说高分辨率的AD到底有什么用呢?
    发表于 01-07 06:49

    差分输入和和单端输入在本质上到底有什么区别?

    和和单端输入在本质 上到底有什么区别? 因为,ADC采集的信号说到底是AINP - AINN,不管单端还是差分,采集的信号都是这两个pad的差值。 2:将单端信号接在ADC的差分输入接口上可以用
    发表于 12-23 07:31

    TFP401APZP到底有没有HSYNC输出?

    请教下TI的大牛,TFP401APZP这颗IC到底有没有HSYNC输出?实测发现HSYNC无输出,是要做什么设置么?!
    发表于 12-20 07:28

    高铁站网约车数智出行到底有智能?

    在当今这个科技飞速发展的时代,智能出行已成为我们日常生活中不可或缺的一部分,而高铁站网约车数智出行更是将这一理念推向了新的高度。那么,这种数智出行方式到底有智能呢? 首先,从预约叫车开始,高铁站网
    的头像 发表于 11-14 14:48 ?650次阅读

    RTOS与Linux到底有什么区别

    很多做嵌入式开发的小伙伴都存在这样的疑惑:RTOS与Linux到底有什么区别?
    的头像 发表于 10-29 09:53 ?1503次阅读

    谷歌开始推送Android 15稳定版

    近日,谷歌正式向Pixel系列设备推送了Android 15稳定版操作系统。目前,已有部分Pixel设备率先完成了系统升级,预计本周晚些时候,更大规模的更新推送将全面展开。
    的头像 发表于 10-17 16:12 ?2125次阅读

    功放和运放到底是什么区别?

    想请问一下功放和运放到底是什么区别,感觉只要接一个小负载,运放的输出电流也可以很大啊?到底有什么区别啊
    发表于 09-10 07:00

    CMOS运放的输入阻抗到底有多高呢?

    都说CMOS运放输入阻抗高,到底有多高呢?可有一个量化指标?
    发表于 09-06 06:59

    求助,这个电路U1A运放同相端的R1电阻到底有什么作用啊?

    想问下这个电路U1A运放同相端的R1电阻到底有什么作用啊?很郁闷。
    发表于 08-27 07:09

    无人机智能巡检系统到底有哪些作用

    系统到底有哪些作用呢? 无人机智能巡检系统主要由无人机、无人机机库、AI算法、红外相机、红外传感器、无人机智能巡检平台等设备共同构成,这些设备能够实时收集并传输巡检图像和视频信息至系统后台,极大提升了巡检的效率和
    的头像 发表于 08-19 16:49 ?915次阅读
    无人机智能巡检系统<b class='flag-5'>到底有</b>哪些作用