0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声智科技发布金融声学AI模型

声智科技 ? 来源:声智科技 ? 2025-08-30 16:26 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在瞬息万变的金融市场中,信息的获取与解读能力决定了投资的成败。然而,传统的文本分析手段,即使是依赖于先进的大型语言模型,也常常受限于精心设计的公司叙事和“言不由衷”的言辞。当企业高管在财报电话会议上谨慎措辞时,真正的风险信号可能被掩盖。

SoundAI公司近期发表在arXiv上的前沿研究《The Sound of Risk: A Multimodal Physics-Informed Acoustic Model for Forecasting Market Volatility and Enhancing Market Interpretability》(风险之声:用于预测市场波动和增强市场可解释性的多模态物理信息声学模型)。

为这一挑战提供了革命性的解决方案。这篇论文不仅展示了声学技术在金融领域的巨大潜力,更揭示了隐藏在言语背后、更难伪装的“情绪生物信号”。

技术核心:PIAM解码非线性情感信号

这篇研究的核心创新在于其提出的物理信息声学模型(PIAM)。与早期依赖手工制作的低级声学描述符(LLD)且在真实世界噪声环境下效果有限的研究(如 DeepVoice 系统)相比 ,声智团队的技术方法是一个重大的进步。PIAM利用强大的自监督编码器直接从原始声音中学习相关表征,绕过了手动特征工程 。至关重要的是,它融合了物理学原理,以确保学习到的声态流形在物理上是合理的。这种将数据驱动学习与第一性原理知识的融合,为分析复杂、嘈杂和基于物理的现象提供了一种有原则的方法 。

即与传统简单地将音频作为“数据”处理的方法不同,PIAM将非线性声学原理作为其内在的物理先验知识。这意味着,该模型能够稳健地从声音中提取情感特征,甚至可以应对如电话会议系统导致的信号失真和削波等非线性现象。PIAM的核心优势在于其多任务输出头,能够同时生成转录文本、对声学情感进行分类,并检测声音事件,从而实现对声音流的整体处理。为了创建一个统一且易于量化的特征空间,研究团队创新性将PIAM声学分析和大型语言模型(LLM)转录文本的情感分析所产生的离散情绪标签,映射到一个预定义的三维情感状态标签(ASL)空间,其维度包括:

张力(Tension):与情感的消极程度相关,捕捉压力与不确定性。

稳定性(Stability):一个为金融分析量身定制的新维度,反映感知到的控制力和可预测性。

唤醒度(Arousal):衡量情感的激活水平。

3e3abe48-84e1-11f0-a18e-92fbcf53809c.png

这种特定于领域的映射,如上表所示,将离散标签转化为一个细致入微、连续的表征,并针对金融特征工程进行了优化。通过将声学与文本的情绪映射到这一空间,研究人员能够构建出捕捉高管从“准备好的陈述”到“自发问答”(Q&A)环节中情绪动态变化的特征。

3e482e02-84e1-11f0-a18e-92fbcf53809c.png

颠覆性发现:波动性预测的「新晴雨表」

这篇论文最引人注目的发现是,高管情绪信号的预测能力存在显著分歧。研究表明,多模态特征不预测股票的涨跌方向(即累计异常回报率,CAR),但它们对未来的市场波动率(realized volatility)具有强大的预测能力。具体而言,该多模态模型能够解释高达 43.8% 的30天实际波动率的样本外方差。这一发现颠覆了我们对情感信号的传统认知,它表明高管的情绪状态并非直接预示公司业绩的走向,而是作为衡量其背后不确定性和认知压力的“晴雨表”。这一结果可以通过以下数据得到直观和量化的支持。下图显示了多模态模型在预测风险(波动率)和回报(CAR)方面的性能差异 。

3e5979c8-84e1-11f0-a18e-92fbcf53809c.png

这对投资者意味着什么?传统的文本分析可能被用于寻找“利好”或“利空”信号,但往往忽略了核心的风险因素。而该研究证明,通过倾听高管在压力时刻(如自发Q&A环节)声音中的细微变化,投资者可以获得一个更直接、更难以被操纵的风险信号。这为投资者和监管机构提供了一个强大的工具,以提升市场可解释性并识别隐藏的企业不确定性。

构建金融分析的“超感知”系统

为了量化声学信息的独特贡献,研究团队进行了严谨的消融实验。结果显示,仅使用财务数据的模型R?为0.251,而整合了声学和文本分析的完整多模态模型R?则飙升至 0.438 。

3e6c4a4e-84e1-11f0-a18e-92fbcf53809c.png

这证明了声学和文本模态提供了彼此正交、互补且极具价值的信息。该研究还通过特征重要性分析,进一步揭示了哪些信号最为关键。结果显示,最重要的预测因子并非来自事先准备好的陈述,而是来自从陈述到问答环节的动态转变。例如,首席财务官(CFO)文本稳定性的大幅下降、首席执行官(CEO)问答环节中唤醒度的高变异性,以及CFO声学稳定性的极端分布,都成为未来波动率的重要预测指标。这表明,对高压时刻的细粒度、角色感知分析,是提取有意义风险信号的关键。

3e7a47a2-84e1-11f0-a18e-92fbcf53809c.png

从数据驱动到“感知”驱动

当然,任何前沿技术都伴随着伦理与局限性的考量。声智明确指出,目前发现的关系是“相关性而非因果性”,同时强调了模型在应用中可能存在的偏见风险,并呼吁防止技术被滥用。未来,这项技术将不仅仅局限于财报会议。它的应用场景将无限延伸,从分析企业谈判、商业路演,到评估消费者情绪,每一次对话都可能成为解码未来趋势的窗口。SoundAI正在将“倾听”转化为一种全新的商业智能,为金融市场带来更透明、更具韧性的未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3852

    浏览量

    139262
  • 模型
    +关注

    关注

    1

    文章

    3577

    浏览量

    50964
  • 声智科技
    +关注

    关注

    0

    文章

    62

    浏览量

    1797

原文标题:全球首发|声智发布金融声学AI模型,解码市场「隐形风险信号」

文章出处:【微信号:声智科技,微信公众号:声智科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智科技声学模型赋予AI感知物理世界

    在科技浪潮的尖端,一个新时代正悄然开启。NVIDIA创始人黄仁勋曾预言,未来通用人工智能(AGI)将不再局限于虚拟世界,而是能够与物理世界深度交互的“物理AI”。图灵奖得主杨立昆和计算机科学家李飞飞
    的头像 发表于 09-02 17:46 ?613次阅读

    科技与极氪9X合作树立车载声学新标杆

    8月24日,以“临奢境”为主题的极氪9X音响品鉴会在上海中心极氪旗舰店圆满落幕。瑞科技作为极氪9X技术合作伙伴,为本次活动提供了全程支持。基于对极致声学体验的共同追求,瑞科技与极
    的头像 发表于 08-28 15:57 ?192次阅读

    智科技与颐堤港共探声学AI落地新场景

    AI浪潮席卷各行各业的当下,商业地产正迎来科技赋能的崭新篇章。2025年8月15日,颐堤港相关负责人一行莅临智科技,双方围绕声学AI技术在商业空间智能化升级中的创新应用与广阔前景,
    的头像 发表于 08-25 17:20 ?523次阅读

    华为亮相2025金融AI推理应用落地与发展论坛

    近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布
    的头像 发表于 08-15 09:45 ?434次阅读

    爱芯元智携手灵境声学推出“爱芯元”音频解决方案

    Umix AI”全景行业大模型的专属音频芯片方案——“爱芯元”。该方案搭载灵境声学自研的“灵境Umix
    的头像 发表于 08-01 10:43 ?2911次阅读

    蚂蚁数科正式发布金融推理大模型

    7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,金融
    的头像 发表于 07-28 16:36 ?336次阅读

    智科技与蚂蚁集团共探声学AI前沿技术

    声学AI遇上金融科技,会碰撞出怎样的火花?当声学AI模型赋能
    的头像 发表于 07-24 10:18 ?526次阅读

    智科技与奥迪联合举办前瞻技术沙龙

    近日,智科技与奥迪联合举办前瞻技术沙龙。活动中,智科技作为声学人工智能领域的领先者,分享了其在构建声学 AI
    的头像 发表于 07-24 10:09 ?445次阅读

    声学世界模型将如何改变我们的生活

    近日,智科技发表标题为“A Survey on World Models Grounded in Acoustic Physical Information”的声学世界模型综述文章,调研了全球研究
    的头像 发表于 06-27 11:36 ?583次阅读

    华为AI模型助力金融行业智能化转型

    第十三届华为全球智慧金融峰会HiFS2025在东莞三丫坡圆满落幕。会议期间,中国邮政储蓄银行(简称“邮储银行”)运营数据中心大模型工作组组长杜金鑫发表题为“AI模型赋能创新,迈向智能
    的头像 发表于 06-14 11:40 ?741次阅读

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态资源,还
    发表于 04-13 19:52

    智科技开创AI硬件出海新范式

    近日,由北京市海淀区人民政府主办的「中丹地方科技产业交流会」在中关村自主创新示范区举行。智携珍珠AI耳机、星环AI耳机、AI助听器等AI
    的头像 发表于 03-17 09:59 ?947次阅读

    软通动力助力金融行业AI应用创新

    随着生成式人工智能技术(GenAI)的迅猛发展,AI模型金融领域的应用正日益深入,逐步成为推动行业创新的重要引擎。近期,由中国人工智能产业发展联盟金融行业推进组牵头编写的《
    的头像 发表于 02-11 09:10 ?667次阅读

    智科技荣获工信部“2024年先进计算赋能新质生产力典型应用案例”

    近日,工业和信息化部网站发布《2024年先进计算赋能新质生产力典型应用案例》公示信息,智科技“基于中医大模型的抑郁症AI自助诊疗平台”作为“未来产业”领域唯一的
    的头像 发表于 12-28 14:57 ?767次阅读

    简单认识智RIC耳背式AI助听器

    在科技与人文交汇的前沿,智科技即将书写助听器行业的崭新篇章,作为一家专注于声学计算与人工智能交叉领域的AI企业,不仅在专业领域持续领跑,更用心倾听听障人群的声音,凭借多年的潜心研发和持续创新
    的头像 发表于 11-26 16:31 ?1510次阅读