算法真能“读心”？-每日短讯

本文来自微信公众号：神经现实（ID：neureality），作者：Grace van Deelen，编译：Blue Froid，原文标题：《算法读心，仅用fMRI即可读取你的所听所想？》，题图来自：《超体》

(资料图片)

科学家首次开发出能通过解码大脑fMRI数据重构出连贯语言的方法。脑机接口为失语或者无法打字的人群提供了辅助技术，而这项新发现满足了改良这项技术的需求。

9月23日，bioRxiv上刊登的一篇预印论文*中，美国德克萨斯州大学奥斯汀分校的团队详细介绍了一种“解码器”（算法）。它可以通过“读取”被试在功能性磁共振成像（fMRI）扫描期间所听所想到的词语。虽然此前也有其他科学团队基于脑植入物传出的信号完成过语言或者图像的重构，但通过这种新型解码器，科学家们首次在无创的情况下也能达到相同目的。

*译者注：预印论文，指未经同行评审、没有正式发表在科学期刊上的文章。

Tang， Jerry， et al. "Semantic reconstruction of continuous language from non-invasive brain recordings." bioRxiv (2022). https://doi.org/10.1101/2022.09.29.509744

德州大学奥斯汀分校的神经科学家、该论文的合著者亚历山大·休斯（Alexander Huth）说道：“如果你去问二十年前的神经科学家们能不能这样解码大脑活动，他们绝对会笑掉大牙的！”

日本京都大学的神经科学家神谷之康（Yukiyasu Kamitani）虽然并未参与实验，但他在给《科学家》（The Scientist）发来的邮件里写道，这种非侵入式解码器能产生可以让人理解的语言序列，这让他感到“非常兴奋”。他说：“这一研究......为（脑机接口）的应用打下了坚实的基础。”

事实上，fMRI产出数据的速度比人类思维的速度要慢很多，因此fMRI并不是很适用于这种研究。大脑活动往往伴随着脑内血流量的变化*，fMRI的原理就是通过检测这些血流的变化成像、对大脑活动作近似，而非直接探测神经元活动。但是相对于发生于毫秒之间的神经元放电，以秒为单位的血流量变化还是较慢。对此，休斯表示能在该研究中使用fMRI的原因在于，他们的实验系统并非逐字解码大脑中的语言，而是辨别句子或者想法这些更高层次结构的意义。

*译者注：血液会流向大脑里更为活跃的区域以供氧。

休斯和同事们在训练算法时用到了三名被试的fMRI大脑数据。被试者均在20到30岁之间，其中有一名女性以及两名男性。在实验过程中，三名被试收听了播客和广播故事，总计16小时。他们听到的内容包括“飞蛾电台”（The Moth Radio Hour）、TED演讲以及约翰·格林（John Green）的《人类史回顾》（The Anthropocene Reviewed）。休斯说，让被试收听不同种类的媒体对于提升算法的准确性和广适性，是很有必要的。他提到，虽然他的研究中被试样本很小，但他们在实验中收集的fMRI数据和其他用fMRI收集数据的实验数量相当。

解码器通过学习被试长达16个小时的fMRI数据，对于fMRI数据的走向做出了一系列预测。据休斯所说，解码器运用“猜测”的能力，是它翻译与训练所用音频内容无关想法的关键。然后，解码器会将“猜测”出来的fMRI数据走向与实际fMRI数据进行对比，与实际最相符的预测决定了解码器最终产生的语词。

研究人员对解码器的产出与被试者感知到的刺激之间的相似性打分，以此判断解码器是否成功。此外，研究人员还给没有比对过fMRI数据的解码器生成的语言打分。接下来，他们对比了这两项得分，并对二者的差别做统计学上的显著性测试。

结果显示，该算法通过猜测-比对的程序最终从fMRI数据中生成了一个完整的故事。对此，休斯评价道，算法还原的内容与录音中实际讲述的故事已经“相差无几”了。不过，解码器也有自己的不足之处。比如它不太擅长解析人称指代，还经常搞混第一人称和第三人称。休斯说，解码器“可以相对准确地知道发生了什么事，但它不太清楚是谁在做这件事。”

并未参与研究的普林斯顿神经科学研究中心研究员以及讲师山姆·纳斯塔瑟（Sam Nastase）认为将fMRI应用于解码大脑“令人兴奋不已”，因为用fMRI提取数据的过程通常又缓慢杂音又多。纳斯塔瑟还说道：“从这篇论文看来，只要我们拥有一个足够智能的模型就可以从fMRI数据中得出数量可观的信息。”

非侵入式fMRI在解码器中的应用有褒有贬。好处在于它比侵入式方法更容易应用于现实世界，而缺点则在于fMRI高昂的费用以及复杂的使用方法。不过，也许我们可以用同样是非侵入式、但更轻便且时间分辨率更高的脑磁图（Magnetoencephalography）技术来支撑类似的解码器，让失语人群有机会与他人沟通交流。

休斯认为，解码器最令人兴奋的成就在于它对大脑运作的洞察力。比如，我们可以从解码器的解析中看出大脑的哪些部分负责建立语义。通过使用解码器记录特定脑区，像前额叶皮层或者顶叶-颞叶皮层，休斯的科学团队能够确定各个区域对应的语义信息。休斯的团队就是这样发现了前额叶皮层和顶叶-颞叶皮层对解码器表征了相同信息的。不管解码器使用来自其中哪一个区域的测量数据都能够很好地完成解析。

休斯还补充道，最令人惊喜的是虽然训练解码器使用的是被试在听取口头语言时的数据，但它却可以重构非语义类别的刺激信号。举例来说，在经过训练后，解码器算法成功重构出了被试在看默剧、或想象自己讲故事的场景时的信息。休斯对此评价道：“这些内容可以被解码器重构出来就证明它们（在大脑中的表征）之间是存在某些共性的。这为我们提供了一个非常新颖的角度。”

神谷和纳斯塔瑟对休斯实验室还未经同行评审的结论提出了这样的疑惑：“解码器在处理潜在含义与处理文本或语音的过程有何不同？”由于休斯实验室的解码器解析的是语义，而非逐个词语，我们难以衡量它成功与否。用纳斯塔瑟的话来说，这是因为有很多种语词的组合都能算作是“好”的输出。“不过他们引入的问题很有意思。”纳斯塔瑟说。

休斯承认，对于一部分人来说，能有效“读心”的技术听起来有些让人毛骨悚然。不过他的团队对研究的现实意义进行了深入的思考。而且考虑到精神隐私的保护问题，他们还研究了解码器是否会在被试不愿意合作的情况下解析信息。在部分实验中，研究人员要求被试者在听取音频时进行其他心理活动来分散自己的注意，比如数数、命名和想象动物、以及在脑子里编一个跟音频内容不一样的故事。最后他们发现，想象动物是最能够降低解码准确率的操作。

从信息隐私的角度来看，用一个人的大脑数据训练出来的解码器是无法被应用到另一个人身上的，用休斯的话说，这“基本上没有提供任何可用的信息”。也就是说，我们只能解析出大量参与了解码器训练的人的想法。

对于纳斯塔瑟而言，研究人员特意关注了是否有精神隐私受到保护的证据，这个做法是值得赞许的。他说：“如果不做精神隐私相关的实验测试，他们完全可以早六个月就发表这篇论文。”不过，纳斯塔瑟并没有完全被研究者提供的隐私保护相关证据说服，因为未来这个方向的其他研究很可能会突破他们设置的精神隐私保护的权宜之计。纳斯塔瑟补充道：“这关乎到我们是否将科技带来的益处看得比这些潜在（道德）陷阱更重要。”

原文：https://www.the-scientist.com/news-opinion/researchers-report-decoding-thoughts-from-fmri-data-70661

本文来自微信公众号：神经现实（ID：neureality），作者：Grace van Deelen，编译：Blue Froid

推荐内容

算法真能“读心”？-每日短讯

CES 2023带来哪些酷炫产品? 有“变色”概念车，也有“黑科技”

AI内容创作火热 深层次应用场景尚待探索

“宅经济”退潮，迷你家电遇冷？-环球焦点

微软的AI赌局，谷歌为何没敢接-当前观察

录音棚般的专业音质！HyperX ProCast声岚专业麦克风评测-全球今日讯

来自等等党的胜利，技嘉RTX 4070 Ti GAMING OC显卡评测

三星展示新款手机OLED屏，亮度达2000尼特，通过UDR 2000认证-当前热闻

高通正式推出卫星通信：只需3秒即可发出信息

京东方苹果显示屏出货快速增加，或将成为苹果最大供应商-全球热头条

银保监会：流动资金贷款期限不得超过3年-天天热文

《米小圈上学记》：“简单快乐”中的“温暖成长”-环球新消息

去太空拍电影？已经有人抢了马斯克的先-聚看点

美国考虑向乌克兰提供布拉德利战车-热闻

嗨fun沃派跳舞合拍大赛举行，青海大学生太会跳了吧！

特斯拉再降价，Model 3等车型售价调至历史新低-热资讯

宁德时代专利获授权 可提高换电安装精度-全球热资讯

万字解读：中国新能源发展现状和趋势-天天关注

两万亿赛道待掘金，智云健康要用数字化覆盖更多医院-全球微速讯

“最重大泄密事件之一” 外媒：推特被曝遭黑客攻击，2亿用户数据恐泄露-全球即时

TCS联合UiPath“业务流程自动化与下一代数字化转型”研讨会在沪召开-当前简讯

魔芯科技首次参展CES 2023，全新升级产品KOKONI SOTA正式发布

解析以太坊2.0、POS质押和TVL 59亿美元的Lido

10M Revenue Drain in 5 Months: MEV impact on Curve-今日热讯

Justin Sun：Huobi计划裁员约20%-世界微资讯

OPPO Find N2系列获得中国市场折叠屏品类市场份额第一-看热讯

花木繁荫鸟筑巢，东升控股集团坚定走矿山复绿的生态之路

《自然》：为什么这60年来，科学家们都懒得做创新了？

海信徕卡激光电视亮相CES 徕卡高层首次透露合作幕后-快看点

Nethermind 研究员发起将Uniswap V3部署至StarkNet主网的提案

美图公司商业化2.0∶VIP订阅、SaaS业务、AIGC技术多元增长-全球视点

OPPO侵权被判赔偿乐视13万元 官网非法提供视频下载服务-环球关注

2022年备受瞩目的冰箱市场有哪些看点?

即将到来！谷歌Pixel Fold预计将于第四季度发布-当前独家

一加11震撼来袭！李杰：在性能赛道上追求极致

一加11最佳拍档！办公出差旅游的绝妙之选-世界聚焦

支持四相位检测自动对焦，豪威发布1/1.3英寸图像传感器-世界播资讯

一图看懂一加 11：强悍的性能+惊喜的定价-动态焦点

公司更名“东方甄选” 新东方在线转型不留退路-环球微速讯

京东方回应拿下苹果手机大单传闻：“目前不便对单一客户信息过多透露”-环球短讯

预测2023：媒体该如何应对三大挑战？

董宇辉们成俞敏洪救星，新东方在线要改名东方甄选，有投资人爆赚5倍

看电视变得太复杂，厂商不该当“甩手掌柜”-环球热讯

苏宁易购为苏宁国际继续提供9900万美元担保-环球热点评

AMD发布锐龙7000系列移动处理器，最高可达16核心-热点评

宏碁CES期间举办全球发布会 掠夺者家族焕新，还有一款能发电的酷骑桌-精彩看点

龙江银行属于什么银行？龙江银行2023年存款利息

基准利率和lpr的区别是什么？基准利率2023最新消息

高杠杆效应金融产品是什么？高杠杆效应金融产品有哪些？

马斯克该远离政治吗？投票结果竟是这样-今日快看

差价合约是什么意思？差价合约和期货的区别是什么？

头寸是什么意思？头寸管理最新消息2022

守宫是什么意思？守宫多少钱一只？

sfb是什么意思？sfb是什么考试？

劳动模范人物有谁？劳动模范人物事迹简介

一斗米等于多少斤？一斗米打一字是什么？

ditto是什么意思？ditto音译歌词是什么？

手机如何投屏到电脑？手机投屏电脑最简单方法有哪些？

wap流量是什么意思？wap流量怎么收费？

效仿董明珠直播带货，国美“最后的挣扎”？-全球球精选

2023家电消费洞察：新兴家电仍在上升通道-最新消息

刘强东最后一个IPO快到来了？-看热讯

家电业回暖在望：高端智能产品走俏，企业抢滩海外市场-天天报道

2023年家电巨头价格战火将重新点燃？

三键导航怎么设置？三键导航的功能是什么？

荣耀80和80pro的区别是什么？荣耀80pro参数价格配置

永远用英语怎么说？永远用数字怎么表示？

同底数幂的加减法怎么算？同底数幂的乘法公式是什么？

服务器内部错误是怎么回事？服务器内部错误怎么解决？

电脑录屏怎么把声音录进去？电脑录屏软件哪个好用？

庹的拼音怎么读？庹在姓氏中念什么？

狐妖小红娘紫星河水晶是谁的？狐妖小红娘紫星河水晶是什么？

梦幻诛仙手游职业推荐有哪些？梦幻诛仙礼包码2022最新

蝙蝠侠阿甘之城怎么设置中文？蝙蝠侠阿甘之城如何切换服装？

地铁离去怎么设置中文？地铁离去增强版和普通版的区别是什么？

以撒的结合忏悔怎么解锁下水道？以撒的结合忏悔控制台代码大全

最终幻想7重制版最强武器有哪些？最终幻想7重制版爱丽丝不死结局

三国志12剧情触发条件是什么？三国志12兵种克制关系

薄暮传说重制版如何安装？薄暮传说重制版内容介绍

AI内容创作火热深层次应用场景尚待探索

宁德时代专利获授权可提高换电安装精度-全球热资讯

OPPO侵权被判赔偿乐视13万元官网非法提供视频下载服务-环球关注

宏碁CES期间举办全球发布会掠夺者家族焕新，还有一款能发电的酷骑桌-精彩看点

2K分辨率下通吃主流3D游戏戴尔高配版游匣 G16 游戏本评测