0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI的“随机性”挑战:它们比人类更“不随机”?

颖脉Imgtec ? 2025-02-20 13:11 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

你有没有想过,人类真的能做出完全随机的选择吗?答案可能出乎你的意料。事实上,人类天生就不擅长“随机”,我们总能在看似无序的事物中发现规律,甚至在本该随机的场景中创造出模式。这种“伪随机”行为,其实是一种独特的人类特质。最近,来自康奈尔大学探讨了大语言模型(LLMs)在随机性方面的表现。他们通过一个经典的实验——生成二进制随机序列,来观察这些模型是否能像人类一样“不随机”,或者是否能真正实现“随机”。

研究结果令人惊讶。研究者发现,GPT-4和Llama-3在生成随机序列时,不仅表现出人类的偏差,甚至还加剧了这些偏差。


真随机 与 伪随机

人类有一种奇妙的天赋——发现规律。我们总能在生活中找到各种模式:在咖啡的奶泡中看到人脸,在星空里描绘出星座,甚至因为忘记穿幸运衫而觉得勒布朗·詹姆斯投篮不中是自己的错。

然而,这种对规律的敏感也让我们在面对“随机性”时变得格外笨拙。比如,当你让一个人随机选择一个1到10之间的数字时,他们大概率会选择7;或者让他们在脑海中抛硬币,结果多半是正面。这些看似随机的选择,其实背后隐藏着可预测的规律。


抛硬币实验背后的秘密

从20世纪初开始,人类对随机性的研究就从未停止。早在1913年,Fernberger就指出,人类生成随机序列的行为是一个复杂而迷人的课题。此后,无数研究发现,人类生成的随机序列与真正的随机序列有着显著的差异。

我们通过一个经典的行为科学实验来研究这一问题:让人类或机器生成一系列随机结果,比如抛硬币的序列,然后将这些序列与真正的随机序列进行比较。简单来说,就是看看这些序列与“纯粹的随机性”有多大差距。


虚拟硬币实验

▎温度参数:AI的“随机性开关”

与人类不同,大语言模型有一个关键参数——温度(temperature)。温度决定了模型输出的多样性:温度越低,输出越一致;温度越高,输出越随机、越多样化。然而,当温度过高(比如超过1.5)时,模型的输出可能会变得混乱,甚至无法从中解析出硬币的正反面。因此,我们的实验温度范围设定在0到1.5之间。

1d96ccd2-ef49-11ef-9434-92fbcf53809c.png

当我们让AI连续抛20次硬币时,结果同样有趣。实验发现,所有模型在序列的第一次抛硬币中都倾向于选择“正面”,这与人类的行为高度一致。无论温度如何变化,这种“正面优先”的倾向始终存在。这不仅揭示了AI在随机性任务中继承了人类的偏差,还表明这些偏差在某些情况下可能被进一步放大。

▎AI的“第一印象”偏差

在我们的实验中,超过88%的AI生成的硬币序列以“正面”开始,这一比例远远高于人类数据。这表明AI在“第一印象”上继承了人类的偏差,并且表现得更加明显。尤其是Llama-3,它的偏差比GPT系列模型更强。GPT-4和GPT-3.5之间也存在差异,GPT-4通常表现出更少的偏差。

1da737f2-ef49-11ef-9434-92fbcf53809c.png

这种“第一印象”偏差不仅出现在硬币的正反面选择中,还出现在其他二元选择中,比如“真/假”或“A/B”。这可能暗示了语言中的“固定二元组”对AI的决策产生了影响。

▎AI的“平衡”偏差

在实验中,GPT-4和Llama-3生成的序列中,正面和反面的比例往往比随机分布更接近50%,甚至比人类生成的序列还要“平衡”。例如,在8次抛硬币的序列中,它们平均会有4次正面,这与人类的行为非常相似。不过,Llama-3在低温时表现出轻微的正面偏好,而GPT-3.5在低温时则表现出强烈的反面偏好,但在高温时会逐渐接近人类的分布。

1db0fce2-ef49-11ef-9434-92fbcf53809c.png

▎连续序列与N-gram模式人类在生成随机序列时,往往会过度切换正面和反面,认为这样看起来更“随机”。研究表明,人类序列的交替比例通常为60%,而真正的随机序列应该是50%。在AI实验中,这种“过度切换”的倾向被进一步放大。例如,在8次抛硬币的序列中,理论上应该平均有3.5次交替,但AI模型的交替次数普遍高于这个值。GPT-4在低温时几乎总是生成“正反交替”的序列,而Llama-3则倾向于生成“正反正反……”或“正反正正……”的模式。

1dee9d18-ef49-11ef-9434-92fbcf53809c.png

本文转自:Coggle数据科学

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281262
  • 语言模型
    +关注

    关注

    0

    文章

    563

    浏览量

    10836
  • LLM
    LLM
    +关注

    关注

    1

    文章

    328

    浏览量

    889
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    蓝牙随机化RPA更新的重要和工作原理

    蓝牙?随机可解析私有地址(Bluetooth? Randomized RPA)更新功能已推出,该更新通过优化可解析私有地址的管理,提高了低功耗蓝牙设备的隐私和能效。本文将介绍蓝牙?随机化RPA更新的重要
    的头像 发表于 07-10 09:36 ?263次阅读
    蓝牙<b class='flag-5'>随机</b>化RPA更新的重要<b class='flag-5'>性</b>和工作原理

    请问如何设置蓝牙静态随机地址?

    您好,我想实现蓝牙地址除了烧录其他场景保持不变,那么想问一下如何将蓝牙地址类型设置为静态随机地址? 我使用了 CYW20835。
    发表于 07-07 08:12

    labview怎么输出不重复的整数随机

    大佬们我想问一下怎么能够生成不重复的随机数,labview能够输出整数随机
    发表于 04-16 11:15

    随机化在PCIe IDE验证中的重要

    本文将探讨随机化在 PCIe IDE 验证中的重要,重点介绍它如何在确保数据完整和加密可靠方面发挥关键作用,同时也揭示了该过程的独特挑战
    的头像 发表于 03-06 09:27 ?540次阅读
    <b class='flag-5'>随机</b>化在PCIe IDE验证中的重要<b class='flag-5'>性</b>

    ADC12DJ3200采样数据在FPGA端随机性出现错点,是什么原因?

    如题,我设置的前台校准,FG—DONE没有拉高,2C1寄存器0000_0010,208寄存器0111_1100。采样数据在FPGA端随机性出现错点。请问是什么原因?
    发表于 11-27 08:10

    内存储器分为随机存储器和什么

    内存储器是计算机系统中用于临时存储数据和程序的关键部件,它直接影响到计算机的运行速度和性能。内存储器主要分为两大类:随机存储器(RAM,Random Access Memory)和只读存储器(ROM
    的头像 发表于 10-14 09:54 ?2984次阅读

    随机内存储器的特点有哪些

    运行时的主要存储器,因为它提供了快速的数据访问速度,这对于执行程序和处理数据至关重要。 随机存取存储器的特点 快速访问速度 :RAM的访问时间非常短,通常在纳秒级别,这使得它能够快速响应CPU的指令和数据请求。 易失 :RAM是一种易失
    的头像 发表于 10-14 09:51 ?1546次阅读

    闪存随机读写与连续读写哪个重要

    快速响应的应用中,如数据库操作、服务器处理请求等,随机读写速度至关重要。 多任务处理能力 : 随机读写能力强的闪存能够更有效地处理多个并发任务,因为它们可以更快地访问和修改存储在不同位置的数据。 连续读写的重要
    的头像 发表于 10-12 11:44 ?1098次阅读

    随机存储器的特点和结构

    随机存储器最显著的特点是其易失,即当电源关闭时,存储在RAM中的数据会立即丢失。这是因为RAM依赖于电流来维持其存储的数据状态。当电源被切断时,RAM中的电容器会迅速放电,导致存储的信息消失。这种特性使得RAM主要用于临时存储数据和程序,如操作系统、正在运行的应用程序以
    的头像 发表于 09-26 18:18 ?2650次阅读

    静态随机存储器的定义和工作原理

    静态随机存取存储器(SRAM)是随机存取存储器(RAM)的一种,以其独特的静态存储方式而著称。所谓“静态”,意味着只要保持通电状态,SRAM内部存储的数据就可以恒常保持,无需像动态随机
    的头像 发表于 09-26 16:25 ?6005次阅读
    静态<b class='flag-5'>随机</b>存储器的定义和工作原理

    eprom可以采用随机存取方式吗

    EPROM(Erasable Programmable Read-Only Memory,可擦写只读存储器)是一种早期的非易失存储技术,它允许用户通过紫外线照射来擦除存储器中的数据,并通过编程器
    的头像 发表于 09-18 11:13 ?2552次阅读

    EMI衰减技术,双随机扩散光谱应用说明

    电子发烧友网站提供《EMI衰减技术,双随机扩散光谱应用说明.pdf》资料免费下载
    发表于 09-11 11:44 ?0次下载
    EMI衰减技术,双<b class='flag-5'>随机</b>扩散光谱应用说明

    雅特力AT32 MCU的随机数生成

    概述产品和生态系统安全的需求比以往任何时候都更加重要。真随机数是所有安全系统的核心,其质量会影响设计的安全。因此在没有内置硬件TRNG的AT32的微控制器系列中,如何提高随机数的有
    的头像 发表于 08-30 12:26 ?1388次阅读
    雅特力AT32 MCU的<b class='flag-5'>随机</b>数生成

    EMI降低技术:双随机展频

    电子发烧友网站提供《EMI降低技术:双随机展频.pdf》资料免费下载
    发表于 08-23 09:16 ?0次下载
    EMI降低技术:双<b class='flag-5'>随机</b>展频

    如何在FPGA中实现随机数发生器

    分享如何在Xilinx Breadboardable Spartan-7 FPGA, CMOD S7中实现4位伪随机数发生器(PRNGs)。
    的头像 发表于 08-06 11:20 ?1250次阅读
    如何在FPGA中实现<b class='flag-5'>随机</b>数发生器