0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音识别大牛Dan Povey因学生闹剧被约翰·霍普金斯大学解雇

DPVg_AI_era ? 来源:lq ? 2019-09-01 07:52 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

语音识别大牛Dan Povey因学生闹剧被约翰·霍普金斯大学解雇,怒拒Facebook“不公平调查”,或投身中国企业并在中国大学兼职。这是近期发生在饱受西方“价值观”争议的Dan教授身上发生的一连串事件,事实说法不一,真相扑朔迷离,但国内学界业界一齐欢迎Dan。

语音界大佬、开源语音识别系统 kaldi 的开发者 Dan Povey 被约翰?霍普金斯大学 (JHU) 解雇了。

Dan Povey

Facebook 马上向 Dan Povey 伸出橄榄枝,Dan 接受了。

但 Facebook 表示暂时只能给 Dan 6 个月的 “合同工” 合约,直到完成对所发生的事情的调查,并将根据调查结果决定是否正式聘请。

Dan 拒绝了,并讽刺 Facebook 的所作所为让他感觉 “déjà vu(似曾相识)”。

Dan 最新在个人主页上的汇报是,他计划去一家中国公司工作,并且 “或许会在一所中国大学兼职”。 消息一出,国内学界业界颇为兴奋,纷纷猜测大神将去哪儿。

来源: 微博 是什么让语音界大佬愤而出走,他在约翰?霍普金斯大学发生了什么?这一切,始于 Dan Povey 一次 “为了夺回服务器” 的反抗,以及因此发生的一场闹剧式的解雇风波。

教授深夜闯入,只为夺回服务器 事情发生在 5 月 7 日的午夜,Dan Povey 带着一把断线钳,试图趁着夜黑风高闯入被抗议的学生占领的行政楼,夺回 CLSP(语言语音处理中心)维护的服务器的控制权。

在这之前,行政楼 Garland Hall 已经被静坐抗议的学生占领长达 34 天,他们将窗户封紧,大门用铁链锁上。

被学生占领的Garland Hall外墙

学生们一是抗议学校设立 Private Police,校方称是为了加强校园安全,而学生们认为这会加剧种族矛盾;学生抗议的第二点是校方与美国移民及海关执法局 (ICE) 签署的培训合约,校方表示,这主要是与医学院签署的紧急医疗培训和领导力教育合同。校长称,他不会终止这些合同,而且这些合同很快就要到期了。

在双方的激烈对峙下,学生们用铁链封锁了 Garland Hall 的大门,以静坐的方式进行抗议。据称,学校曾同意和抗议学生坐下来开会谈,只是因为通知时间只有 12 个小时, 学生们拒绝了会谈。

大楼内部

但 Dan 负责维护的 CLSP 的服务器在大楼里,在试图向学校申请进入大楼维护服务器无果之后,他决定阻止这场抗议。

Dan 以工作狂闻名,他的学生 Guoguo Chen 在知乎上说:“这么些年和 Dan 接触下来,感觉有两个点是不能触碰的,一个是时间,一个是服务器。”

Guoguo Chen 说:“Dan 还有一个不能接受的便是服务器的不稳定。Dan 在很多事情上都比较宽容,但是如果谁乱用了服务器的资源,会收到 Dan 非常严厉的警告。Dan 觉得数据和计算资源,对整个 CLSP 来说,都是非常非常重要的资产,需要随时保证 CLSP 的每一个人都可以使用到。我相信这也是为什么 Dan 在这次事件中,会试图夺回服务器,避免数据和及其资源的损失。”

根据当地报纸的报道,那天夜里,在其他六名 “社会闲散人士” 的陪同下,Dan 携带钳子前往大楼,费力地试图剪断抗议学生在门上绑的铁链,夺回服务器的控制权。

视频拍摄到Dan被学生们推出大楼 但他失败了。随即引发了肢体冲突,Dan 被学生们推挤出大楼,而与他同行的另一名男子被指殴打了抗议学生一拳。Dan 说,学生们把他带出大楼时刮伤了他,背上一道大划痕;学生们也向他带去的人挥了很多拳,而他们表现出令人钦佩的克制,虽然有一人回敬了一拳。

据称,闯入大楼前几小时,他带着写着 “不要让我跟你妈妈告状、让工作恢复正常运行吧” 的看板前往现场。

Dan 在他的网站上解释,强行进入大楼是因为研究用的服务器故障,而该服务器在学生占领的大楼内。

在 Dan 试图进入被占领的大楼数小时后,5 月 8 日早晨,将近 100 名巴尔的摩警察包围了大楼,警察清理了大楼并逮捕了七名抗议者,但该市的最高检察官后来放弃了对他们的所有指控。

Dan遭解雇:我依旧保有尊严和独立的思想

Dan Povey 是语音界赫赫有名的大佬,根据 LinkedIn 的信息,自 2012 年以来,他一直在约翰?霍普金斯大学担任助理研究教授。在加入霍普金斯大学之前,他曾在微软和 IBM 担任研究员。

“夺回服务器” 事件后,Dan Povey 先是被停职,随后在 8 月 8 日,被校方以 “危害学生安全” 为由解雇。

“作为约翰?霍普金斯大学的一名教员,你制造了一个危险的局面,最终可能对我们的学生、你自己和社区里的其他人造成严重伤害,”Dan 公开了这封解雇信,解雇将于 8 月 31 日生效。

该学院副院长 Andrew S. Douglas 表示,校方正在调查该事件中Povey是否使用暴力,以及是否有种族歧视动机。

不过,Dan 说他会提前离开。他在自己的网站上辩护说:“或许我失去了工作,但至少我依旧保有尊严和独立的思想。”

他说,自己被炒鱿鱼是因为他是白人男性,而抗议的学生是少数族裔。在个人主页的陈述中,他写道:“对于美国人及美国各类机构而言,似乎没什么比被指控种族主义(或类似主义)更可怕的了。这导致了我们这里看到的荒谬的事实:如此巨大的机构竟因几个被蛊惑的孩子陷入瘫痪。”

他表示自己有很多出路:“我告诉朋友,再不济我就到中国或者俄罗斯去。但我要告诉各位,不论发生什么,我永远不会道歉,不会退缩。”

最后,我留下几句鲍勃?迪伦的歌词:

我不对我做的任何事感到遗憾我很高兴我战斗了,我只希望我们胜利

按计划,Dan 本月 19 日就开始在 Facebook 西雅图办公室工作,为 Facebook 的语音识别效力。他曾表示希望能扮演好新角色,但如果摆脱不了争议也不足为奇,他说:“我想在我表达了如此的观点之后,恐怕在任何硅谷大公司也撑不了多久。”

但这个计划也生变了。上周五,Dan 在个人网站更新了他的动向:

他说:

我将不再为 Facebook 工作。我本来要在 19 号星期一开始全职工作;他们昨天,15 号星期四告诉我,不是这样。从技术上讲,他们没有撤销 offer;我将被允许以全职合同工的身份为他们工作至多 6 周,同时 (在我的配合下),他们将对所发生的事情进行独立调查。我是否最终得到全职 offer,将取决于调查结果。我拒绝了那个提议;整件事给我一种似曾相识的感觉。

当然,我知道把这个页面保留下来几乎肯定会结束我在 Facebook 的工作。我周围的每个人都在求我把它撤下;但是我说,我怎么能要求别人要像个男子汉,然后自己却变成一个懦夫呢?

如果有人好奇,我的计划是去一家中国公司工作,也许还会在一所中国大学找到一份兼职。

语音界传奇Dan,开发Kaldi撑起语音识别开源软件半边天 非语音方向的读者可能不熟悉 Dan Povey,在语音界,Dan Povey 可以说是一个传奇。

略扫一遍知乎上的讨论,我们发现,Dan 教授在学生中有着极高的声誉,他的一堆 “标签” 甚至让路人圈粉。

他曾经的学生说:“Dan 是我见过的最纯粹耿直善良的 researcher,不仅学术水平极佳,至今仍居 coding 一线,灵感来了写代码写到不舍昼夜,仅靠一个土豆维生。”

工作狂:Dan 是个工作狂,据称,他每天工作 14 小时以上,除了回复邮件,就是在写代码;

热心:关心学生、主动兼任维护服务器、出来开会曾为了帮助穷学生而 share 旅馆,甚至经常给无家可归者钱;

纯粹:他的理想是 “干掉” Nuance(一家早期非常有名的语音识别公司),给大家提供免费的语音识别工具。这让他在并不十分美好的巴尔的摩一呆就是 7 年,全心地开发和维护 Kaldi;Kaldi 的论坛上,几乎每个帖子都能得到回复,Dan 回复邮件几乎是有求必应。

……

Dan Povey 最著名的工作是领导开发了Kaldi,这是一个开源的语音识别工具包,在 Apache 许可下免费提供。

Kaldi 旨在为语音识别开发者提供灵活、可扩展的软件,支持线性 linear transforms、MMI、 boosted MMI 和 MCE 判别训练、特征空间判别训练和深度神经网络,并且已经提供 TensorFlow 集成。

关于 Kaldi 名字的来源,据说 Kaldi 是传说中发现咖啡的咖啡之神的名字,Dan 希望工具包像咖啡那样容易、方便、流行。

现在,Kaldi 已经成为最广泛使用的开源语音识别工具包之一,许多语音识别团队都依靠 Kaldi。这套工具包自 2011 年发布以来,下载量已经超过了两万多次,合著的论文目前也已经被引用一千多次。可以说 Kaldi 撑起了语音识别开源软件的半边天。

Kaldi 的影响是巨大的,它是第一个完全用 C++ 编写的,基于加权有限状态及理论的语音识别开源软件,它的模块化与高度可扩展性设计,详细的说明文档,完备公开的教程,也是它受广大开发者喜爱的一个主要原因。

它目前被业界广泛采用作为标准工具,包括学术界的 MIT、CMU、GHU、剑桥,国内的清华、上海交大等等,工业界包括微软、谷歌、IBM,Facebook 等等,它的推出也极大推进整个语音识别领域的发展。

有趣的是,Dan Povey 也是剑桥大学语音识别工具包 HTK 的作者之一,他是领导 HTK 工具包开发的 Phil Woodland 教授的学生。经过若干年的发展,Kaldi 集成的技术已经多于 HTK,老师开发了第一代语音识别开源软件,学生开发了第二代语音识别开源软件。

最后,欢迎Dan来中国,不知道哪个公司或学校最终能捡到这个宝贝呢。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    57193
  • 语音识别
    +关注

    关注

    39

    文章

    1789

    浏览量

    114502

原文标题:语音界传奇Dan Povey突遭美霍普金斯大学解雇,计划转投中国

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别(AutomaticSpeechRecogni
    的头像 发表于 08-15 15:13 ?953次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b><b class='flag-5'>识别</b>算法

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音
    发表于 08-09 10:54

    2025 RT-Thread 大学生夏令营开启报名! | 论道大赛

    2025RT-Thread大学生夏令营这是一场专为高校学生打造的高强度技术实践盛宴:开源操作系统学习+随机分配硬件竞赛+作品展示答辩,带你从理论走到实践、从创意到真实作品,完整体验研发全过程!在这里
    的头像 发表于 07-07 18:04 ?984次阅读
    2025 RT-Thread <b class='flag-5'>大学生</b>夏令营开启报名! | 论道大赛

    KLA Corporation连续两年荣登“中国大学生喜爱的雇主品牌”

    ? 近日,中国权威人力资源服务商前程无忧正式揭晓“2025中国大学生喜爱的雇主品牌”榜单。 KLA凭借其在雇主品牌建设、校园人才吸引与培养等方面的持续投入和卓越表现,以及历年来在大学生群体中积累
    的头像 发表于 06-12 10:57 ?698次阅读

    语音识别技术在通信领域中的应用实例

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和
    的头像 发表于 02-21 17:12 ?807次阅读

    详解语音识别技术在通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和
    的头像 发表于 02-21 17:05 ?868次阅读
    详解<b class='flag-5'>语音</b><b class='flag-5'>识别</b>技术在通信领域中的应用

    语音控制热水器WTK69000离线语音识别芯片方案:迈向智能家居新时代

    在传统热水器使用中,人们往往需要手动调节水温、选择模式,这不仅操作繁琐,而且容易误操作导致不必要的能源浪费。为了改善这一现状,热水器厂商开始引入语音识别技术。通过语音
    的头像 发表于 02-21 14:36 ?494次阅读

    NRK3502系列芯片 | 制氧机离线语音识别方案

    NRK3502芯片制氧机离线语音识别方案制氧机离线语音识别方案是基于NRK3502蓝牙双模智能语音IoT芯片,依托于九芯电子在
    的头像 发表于 12-04 01:02 ?581次阅读
    NRK3502系列芯片 | 制氧机离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>方案

    语音识别与自然语言处理的关系

    在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的语音,而自然语言处理则让
    的头像 发表于 11-26 09:21 ?1678次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音识别技术的应用不仅提高了工作效率,也极大
    的头像 发表于 11-26 09:20 ?1792次阅读

    ASR与传统语音识别的区别

    ASR(Automatic Speech Recognition,自动语音识别)与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比: 一、技术基础 ASR : 基于深度学习算
    的头像 发表于 11-18 15:22 ?1581次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 ?2282次阅读

    物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

    01 物联网系统中为什么要使用离线语音识别芯片 物联网系统中使用离线语音识别芯片的原因主要基于以下几个方面: 1、实时性与可靠性 实时性好:离线语音
    的头像 发表于 09-26 17:56 ?1744次阅读
    物联网系统智能控制产品的<b class='flag-5'>语音</b><b class='flag-5'>识别</b>方案_离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片分析

    WTK6900FC语音识别模块

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月25日 17:35:07

    唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月12日 17:24:28