0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

脑电波翻译成句子错误率低于3%,实现专业级转录

独爱72H ? 来源:镁客网 ? 作者:镁客网 ? 2020-04-02 16:25 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:镁客网)

在脑机接口赛道上,此前国内清华大学脑机接口实验室曾经让人们成功通过外接设备实现“脑电波打字”,浙大团队也借助颅内脑机接口设备让中风患者控制机械臂做到喝可乐等。而现在,最新《自然·神经科学》的一篇论文显示了脑机接口领域的一项新突破,来自美国加州大学旧金山分校的神经外科教授Edward Chang及其同事,让机器能够将脑电波信号直接翻译为文字语句,意味着人不张口就能“说出”心中所想。

在Edward Chang的研究中,他们分别将用以检测癫痫的电极植入到4名受试者的颅内,这些电极会将他们大声读出句子时的神经活动记录下来。之后,这些记录会被添加到一个循环神经网络中,继而将规律性出现的神经特征表现出来,该特征可能与言语的重复性特征(元音、辅音或发音器官接受的指令等)相关。紧接着,另一个循环神经网络将进行逐字解码,最后形成一段句子。

Edward Chang及团队在文中介绍称,他们通过该机器翻译方法解码并转换神经活动的错误率低至3%,已经能够媲美于专业级言语转录。此外他们在实验过程中还发现,如果利用某人的神经活动和言语对循环网络进行预训练后,再在另一名实验者身上进行训练,最终的解码结果会有所改善,这意味着这一方法在不同人员之间或将实现转移。

可以预见,当这一成果被用于临床,那些失语者以及中风患者等群体,将能够借助脑机接口技术重新正常发声,在不开口的前提下,摆脱手语等辅助表达。另外,如果再配以一个搭载自然语言处理技术的扬声器系统,该类群体也能够通过语音实现交流。

脑机接口是前沿科研之一,不仅吸引了Facebook等企业和资方的关注,也成为创业热门领域之一。就在前不久,马斯克的脑机接口创业公司Neuralink已经取得了新的突破,发布了“脑后插管”的新技术,声称能够通过一台神经手术机器人,像微创眼科手术一样安全无痛地在脑袋上穿孔,并向颅内植入芯片。

具体到研究项目,“脑电波转换成文字”是重点领域之一,涉及两个研究方向,一个方向专注于控制,另一个方向专注于转换。在“控制”这一赛道上,团队会在与脑机接口系统连接的电脑中设置一个输入法,继而利用神经网络算法对受试者颅内电极所捕捉的脑电波信号进行解析和转换,让受试者能够实现“脑电波打字”,通过控制键盘输入来表达自己内心所想。

只不过,相比于人们自然交流的语速,这类通过大脑控制打字的方法显得非常低效。相比于“控制”,“转换”在难度上则高得多。包括马金团队在内,诸如Facebook等企业和高校团队也在致力于这方面的研究,意图通过神经网络算法,将颅内电极所捕捉的信号直接解码并转换为文字或语音。

在速度上,这类方法有可能达到人类正常水平。就在Edward Chang及团队于去年发布的一个研究成果中,他们已经让AI能够以每分钟150个词的速度将人类的脑电波转换成语言。从临床意义上来看,这类脑机接口技术对部分群体带来的利好是肉眼可见的。而在更广范围内,“脑电波转换成文字”能够带来的效益远不止于此。

智能家居为例,从最初的手动开关到现在的语音交互,这一场景下的控制方式已经从动手变成动口。但在更多人所畅想的场景中,他们甚至已经不想再动口,而是希望当自己脑海中出现某一个念头的时候,脑机接口系统能够将信号转换为机器可理解的文字,继而所涉及的家电等设备主体能够在时间上无缝衔接,执行人们脑海中的指令。

不过这里需要注意的是,目前的脑机接口研究项目中,在获取脑电波信号环节,研究员们所采取的措施还是以颅内电极为主。

不可否认,这一方式能够更为精准的获取脑电波信号,从而方便接下来的信号解码和转换等。不过,就商业落地而言,虽然这类技术取得的成果是有目共睹的,但是诸如安全、伦理等问题也是事实存在的,距离更大范围应用还有很长的路。相比之下,更多创业公司选择外接脑机接口设备,牺牲部分准确性,提高安全性。随着脑机接口技术不断取得突破,并寻找到可落地场景,想必脑机接口将迎来新一波热度。

(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器翻译
    +关注

    关注

    0

    文章

    141

    浏览量

    15236
  • 脑电波
    +关注

    关注

    0

    文章

    60

    浏览量

    17370
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Made with KiCad(138):AnyShake Explorer一款开源、专业级的地震监测系统

    “? AnyShake Explorer 是一款开源、专业级的地震监测系统。在一个“黑箱”、价格高昂的系统已成常态的领域,Explorer 改变了这一切。 ” ? Made with KiCad
    的头像 发表于 08-11 11:19 ?888次阅读
    Made with KiCad(138):AnyShake Explorer一款开源、<b class='flag-5'>专业级</b>的地震监测系统

    AI耳机变身翻译官+会议总结大师?涂鸦AI音频开发方案,让耳机升级到下一个level

    在接入AI能力后,耳机这种日常化的产品,能有多大的想象空间?它不仅能帮你轻松听懂全球外语和地方方言,还能将语音转化为文字、翻译成不同语言,甚至自动总结会议要点、生成思维导图,适配办公、学习、跨语言
    的头像 发表于 07-10 18:47 ?662次阅读
    AI耳机变身<b class='flag-5'>翻译</b>官+会议总结大师?涂鸦AI音频开发方案,让耳机升级到下一个level

    水表界的“翻译官”:让CCLinkIE和Modbus TCP“无障碍聊天”!

    ”,接收控制指令;转身又在Modbus TCP网络中当“指挥主站”,把指令翻译成水表能懂的格式。核心秘诀是地址映射:通过配置工具,将PLC的软元件地址(如D1000)与水表的Modbus寄存器地址(如
    发表于 07-10 15:43

    松下推出专业级手持摄像机AG-CX100MC

    松下公司近期发布了专为视频制作、广播电视及流媒体分发领域量身打造的专业级手持摄像机——AG-CX100MC。该摄像机支持4K 60p 10-bit超高清拍摄,旨在为专业用户带来极致的影像体验。
    的头像 发表于 05-29 09:23 ?698次阅读

    国产低噪声4/6/8通道24位模数转换器软硬件替换AD1299应用于脑电波

    国产低噪声4/6/8通道24位模数转换器软硬件替换AD1299应用于脑电波
    的头像 发表于 05-07 09:47 ?409次阅读
    国产低噪声4/6/8通道24位模数转换器软硬件替换AD1299应用于<b class='flag-5'>脑电波</b>

    自然语言处理的发展历程和应用场景

    你是否曾经对着手机说:“嘿,Siri,今天天气怎么样?”或者在出国旅行时,打开翻译软件,对着菜单说:“请把这道菜翻译成英文”。
    的头像 发表于 04-17 11:40 ?835次阅读

    Normal Awake脑电波形时域分析参考

    应用,系统解析清醒状态下脑电波的时域特征,并探讨其分析要点与鉴别陷阱。HUIYING清醒脑电波的核心成分与参数清醒状态下脑电活动以α波与β波为主导,其分布、频率及波幅
    的头像 发表于 03-21 21:09 ?1237次阅读
    Normal Awake<b class='flag-5'>脑电波</b>形时域分析参考

    思看3DeVOK MT专业级三维扫描仪:多光源技术解析与应用优势

    深入解析3DeVOK MT专业级三维扫描仪的三种光源技术性能和应用场景的深入分析。 ? - 3DeVOK MT 设备结构图 1、 34束蓝色激光线——兼具高精度和高效率 高精度与高分辨
    的头像 发表于 03-06 11:03 ?514次阅读
    思看<b class='flag-5'>3</b>DeVOK MT<b class='flag-5'>专业级</b>三维扫描仪:多光源技术解析与应用优势

    思看科技2025年首款新品:3DeVOK MT专业级三维扫描仪全球首发!

    2025年2月10日,思看科技(SCANTECH)正式发布3DeVOK MT专业级三维扫描仪。3DeVOK MT一机多能,专业出众,源于工业
    的头像 发表于 02-11 14:51 ?1078次阅读
    思看科技2025年首款新品:<b class='flag-5'>3</b>DeVOK MT<b class='flag-5'>专业级</b>三维扫描仪全球首发!

    AI助力实时翻译耳机

    是一种能够实时将一种语言翻译成另一种语言的耳机设备。它通常由一个耳机和一个配套的应用程序组成,用户可以通过应用程序选择需要翻译的语言,并通过耳机听到翻译结果。 2 实时翻译耳机是如何工
    的头像 发表于 01-24 11:14 ?1991次阅读
    AI助力实时<b class='flag-5'>翻译</b>耳机

    OpenAI攻克Sora视频创建错误率高难题

    在人工智能与多媒体技术的交叉领域,OpenAI近期宣布了一项重要进展:成功解决了Sora视频创建过程中错误率高的问题。这一突破不仅标志着OpenAI在视频处理技术上取得了显著进步,也为广大用户带来
    的头像 发表于 12-31 10:37 ?619次阅读

    LLMWorld上线代码翻译新工具——问丫·码语翻译侠,快来体验!

    应用案例 aicode.llmworld.net 案例一 阅读复杂算法,将计算机语言翻译成自然语言和伪代码,快速帮助用户理解算法实现逻辑。 Input(C++): 正弦波信号进行傅里叶变换,并输出其频域结果的C++
    的头像 发表于 12-09 11:11 ?1128次阅读
    LLMWorld上线代码<b class='flag-5'>翻译</b>新工具——问丫·码语<b class='flag-5'>翻译</b>侠,快来体验!

    ADS1299EEGFE-PDK按照手册里设置后,无法产生正常的脑电波波形是怎么回事?

    ADS1299EEGFE-PDK按照手册里设置后,无法产生正常的脑电波波形,如图: 我的软件配置: 手册里设置截图:
    发表于 12-04 07:55

    ADS1299开发板怎么接线测脑电信号,用什么样的线采集脑电波,在哪个位置?

    ADS1299开发板怎么接线测脑电信号,用什么样的线采集脑电波,在哪个位置
    发表于 11-26 06:51

    思必驰发布AI办公本Turbo,搭载专业级跨模态会议大模型

    近日,思必驰正式发布了其最新的AI办公本Turbo,该设备搭载了专业级的跨模态会议大模型。这一创新技术的引入,标志着思必驰在智能办公领域迈出了重要的一步。
    的头像 发表于 10-31 17:03 ?1103次阅读