我常想,假如上帝给我三天光明,我最想看什么呢?或者我将怎样享受这份幸福呢?当我这样想的时候,也请你想一下吧。请想想这个问题,假定你也只有三天光明,那么你会怎样使用你的眼睛,你最想让你的目光停留在什么地方呢?
——海伦·凯勒
生活在一个多彩的世界,我们总会痛惜海伦·凯勒失明的遭遇,并被她对明媚世界的无限憧憬所触动。而现实生活中,全球至少有22亿人视力受损或失明。视觉皮层恢复技术的发展,特别是近年来视觉皮层假体的研究,为他们带来了一线希望。然而,即便是恢复了视力,我们又如何确知他们所见的世界究竟如何呢?
虽然目前已有三项视觉皮层假体的临床试验正在进行(其中一项使用表面电极,由Second Sight Medical Products公司开发的Orion1,2,另外两项使用深部电极3,4),但对于假体植入后视力能恢复到何种程度,我们尚无法预测。此外,神经植入领域依然大量依赖直觉和经验,这可能会带来严重的直观谬误。
在最新发表于Scientific Reports的文章中5,华盛顿大学的Ione Fine 和Geoffrey M. Boynton描述了一种基于视觉皮层(V1)神经生理结构的“虚拟患者”模型,成功预测了参与者在广泛的、已发表的人类皮层刺激研究中所产生的感知体验。模拟结果表明,更多的、更小的电极并不能保证更好的视力恢复。在可预见的未来,皮层假体设备的感知质量可能更多地受制于视觉皮层的神经生理组织,而非技术限制。
现有视力恢复技术和难题
目前,全球正在紧锣密鼓开发各种视力恢复技术。至少有八个团队在开发视网膜电子植入物,其中两个设备已获准用于患者6–12,其他设备正在进行临床试验13。光遗传学是另一项有前景的研究方向,初步结果显示一项临床试验报告了有限的视力恢复。Leber先天性黑矇的基因治疗已经获得临床批准,许多其他基因治疗正在开发中。视网膜上皮和干细胞移植也在迅速进展,几项I/II期临床试验正在进行中。此外还有各种其他有前景的疗法正在开发中。
然而,所有这些疗法都是视网膜干预,无法用于治疗诸如视网膜脱离,或存在视网膜神经节细胞或视神经不可逆损伤的疾病,比如小儿先天性青光眼。这极大的引发了人们对通过修复大脑皮层视觉中枢来恢复视力的兴趣。自2017年以来,已有三项视觉皮层假体的临床试验启动。虽然这些临床试验基于大量已有文献(详见表1),并且同时检验了短期和长期的皮层刺激的效果。但是,迄今为止,这一系列研究的结果几乎完全是描述性的。
目前,我们不可能在视觉皮层假体植入人类之前预测其恢复视力情况。神经植入领域仍依赖于直觉和经验。例如,从直觉上来想,我们会认为更多的、更小的电极能带来更好的分辨率。然而实际情况真如此吗?
▷表1 描述人类皮层电刺激感知效果的论文
Ione Fine团队14通过建立基于V1区神经生理结构的计算模型或“虚拟患者”,成功预测了多项已发表的人类皮层刺激的感知体验,包括电刺激所引起的人类感知的位置、大小和亮度、以及时空形状,试图在视觉皮层假体植入人类之前预测其所产生的感知体验。
“虚拟患者”解决数据不足问题
基于之前对视网膜假体刺激的模型,Ione Fine团队提出了一套创新的理论框架。他们将皮层植入物中的电流进行时间上的整合,并将其转化为神经信号的强度。具体而言,这一模型对神经元群体进行刺激而产生的感知,是基于每个细胞的感受野进行的线性求和,并根据每个时刻该位置的神经信号强度进行加权获得。尽管该模型在数学原理上简洁明了,且未经过复杂的参数调整,却成功预测了多种皮层刺激数据。
▷Fine, Ione, and Geoffrey M. Boynton. "A virtual patient simulation modeling the neural and perceptual effects of human visual cortical stimulation, from pulse trains to percepts." Scientific Reports 14.1 (2024): 17400.
(1)从脉冲序列到感知强度的时间转化
在模型的设计中,Ione Fine团队使用了一种快速的时间整合阶段,这一阶段通常被认为反映了细胞对电流的即时整合过程,用以生成“尖峰活动强度”的衡量指标。他们进一步假设了一个尖峰的不应期,即细胞在一次激活后需要一段时间才能再次响应刺激。紧接着,模型进入一个较为缓慢的整合阶段,并引入了压缩非线性关系,如图1所示。
为了实现这一过程,他们使用了一个简单且成熟的单阶段泄漏积分器进行建模。在这个积分器中,去极化速率与当前的去极化水平及输入电流成正比。这意味着,电流的变化会直接影响细胞的去极化速率。在模型的第一阶段,输出的“尖峰响应强度”并不仅仅代表单个尖峰,而是反映了来自不同激活敏感性的细胞群体的尖峰募集情况。压缩非线性关系不仅捕捉了这一细胞群体中的饱和现象,还体现了更为复杂的皮层增益控制机制的影响。
▷图1. 从脉冲序列到感知强度随时间变化的转换示意图
(2)视觉主导柱、方向针轮和感受野
在初级视觉皮层(V1)中,存在着复杂而有序的神经结构,这些结构决定了我们如何感知和处理视觉信息。图2基于Rojer和Schwartz的工作,展示了这些结构的模拟结果。其中对视觉方向敏感的方向柱(图2B),是通过对随机白噪声信号进行带通滤波后得到的,其滤波后的角度反映了神经元对不同方向的偏好。Ione Fine团队随后扩展了模型,加入了视觉主导柱(图2C),这些主导柱是沿单一方向对同一白噪声信号的梯度,从而形成了正交排列的视觉主导柱和方向柱。这些柱状结构与在猕猴和人类中实际测量到的视觉主导和方向柱图谱高度相似。
单个感受野(图2F)是视觉系统中负责接收和处理光信号的基本单位。它使用简单模型生成,通过加性组合“开”和“关”子单元,子单元的空间分离来自单峰分布。用于生成方向和视觉主导图的同一带通滤波白噪声,也用于生成控制“开”与“关”感受野分离(δon–off)和“开”与“关”感受野相对强度(won-off)的图。
预测的光点是通过将每个皮层位置感受野的轮廓线性相加,并根据该位置的电刺激强度进行加权生成的。这意味着,电极位置的刺激强度直接决定了感知到的光点的亮度和大小。
▷图2. 皮层模型示意图
(A) 从视觉空间到皮层表面的变换。(B) 方向针轮图。(C) 眼位优势列。(D) ON和OFF亚单位空间分离。(E) ON与OFF相对强度。(F) 感受野大小。
(3)光幻视阈值和亮度作为电刺激时间特性的函数
Ione Fine团队将模型预测与各种脉冲序列中测量的电流幅度阈值和亮度评级的数据进行了比较,该模型能够准确地描述脉冲序列如何随着时间变化转化为感知强度,从而成功预测了在各种脉冲参数、电极位置和电极尺寸条件下的光幻视阈值和亮度评级。这意味着,无论电刺激的频率、脉冲宽度或电极的具体位置和大小如何变化,模型都能可靠地预估出患者的感知体验。
(4)光幻视大小与电流幅度和偏心率的关系
除此之外,Ione Fine团队1的模型也成功地预测了光幻视大小如何随着电流幅度和视觉场的偏心率而变化。研究发现,随着电流幅度的增加,光幻视的大小也随之增大,这与患者的实际感知数据高度相关。这表明,电流幅度是决定光点大小的关键因素之一。此外,模型还显示,光幻视的大小随着视觉场偏心率的增加而增大。这意味着,位于视野边缘的电刺激会产生比中央更大的光点。
(5)形状识别
在研究中,团队比较了同时刺激和按顺序刺激两种不同的电刺激方式所产生的感知体验。结果显示,当多个电极同时被刺激时,模型无法正确识别出完整的字母形状,这与患者的实际体验一致。然而,当电极按照书写顺序依次刺激时,模型能够准确地识别出字母形状。这一发现揭示了一个关键点:同时刺激时,感知的光点难以被正确分组和解释,而按顺序刺激则能够形成可辨认的形状。
这种现象可能源于“格式塔”效应的失败。格式塔心理学强调整体大于部分之和,说明我们的感知系统倾向于将散布的光点整合成有意义的整体。然而,由于模型中未包含电场或复杂的神经时空交互,同时刺激时,光点无法被正确分组,导致形状识别的困难。而顺序刺激则通过时间上的分离,减少了光点之间的干扰,使得感知系统能够更有效地整合信息,正确识别出形状。
(6)使用“虚拟患者”预测新设备的感知结果
Ione Fine团队的模型能够复制如此广泛的数据,表明它可以提供对新技术可能的感知体验的洞察——这正是“虚拟患者”模型的重要用途之一。
图3使用“虚拟患者”模型对不同大小电极可能产生的感知体验进行了探究。图3A 中,模拟阵列采用了极小电极(尖端面积介于500-2000μm²之间),模型预测的视觉光点显示出与初步实验数据一致的结果:相邻电极之间的光点无法被清晰区分。这一预测与患者的预实验观察相符,表明当电极刺激间隔在0.4至1.85毫米之间时,无论是单个还是多个电极的刺激,都会产生形状不规则的光点。这意味着,使用极小电极可能会同时刺激到调谐方向相似的神经元群体,导致感知光点呈现出拉长或复杂的结构。
图3B和3C进一步研究了电极大小对患者感知的影响。对于电流扩散有限的小电极(刺激的皮层组织半径小于0.25毫米),模型预测产生的光点结构复杂,如图3B上半部分所示,此时电极的大小对光点的外观或大小影响甚微。当电极半径在0.25毫米到1毫米之间时,光点开始近似于“高斯斑”(Gaussian blob),但光点的大小仍主要由感受野的大小决定,而非刺激区域的扩展范围。只有当电极半径超过1毫米时,电极的大小才会显著影响光点的尺寸。
关键是,模型表明在整个视觉领域中,感受野对光点大小施加了生理学上的“下限”。具体而言,将刺激区域的半径缩小到0.5毫米以下,可能不会显著提升视力,反而可能导致光点变得难以解读。
▷图3. 使用“虚拟患者”预测感知结果
(A) 显示了包含非常小的深度电极阵列的模拟感知。下左面板显示了阵列中电极的位置和大小。右上面板显示了三个单独电极的示例感知。下面板显示了同时刺激成对电极组合时的预测结果。(B, C) 显示了不同电极大小和皮层位置下的模拟预测感知形状和大小。面板C中的狭窄阴影区域表示5–95%的置信区间。
同样的,更多的电极能否带来更好的视力恢复呢?
Ione Fine团队通过图4对三种不同电极阵列配置的感知结果进行了模拟,揭示了这一问题的复杂性。
图4A展示了电极在视觉空间中进行规则排列的情况。这种排列方式在中央凹区域(视网膜上负责高分辨率视力的区域)产生了稀疏的小光点,明显低估了该区域的感知能力。这意味着,尽管电极数量增加,但在中央凹区的光点分布不够密集,无法充分利用该区域的高分辨率潜力。
▷图4. 比较不同电极阵列配置的模拟
(A)视觉场中的电极规则间隔布置。(B) 皮层表面上的电极规则间隔布置。(C) ‘最佳’间隔。
图4B则展示了电极在大脑皮层表面的规则排列。这种配置的问题在于,中央凹区域的电极过度集中,导致感受野之间出现大量重叠。结果,这些重叠的感受野并未带来分辨率的实质性提升。事实上,在中央凹区域附近的电极几乎投射到同一视觉空间位置,使得即使电极位置有微小变化,光点的位置变化对于患者来说也是难以察觉的。这一发现挑战了传统观点,即认为V1中中央凹区域的广泛扩展能够支持较高的空间位置采样能力。
图4C展示了一种“最佳”电极配置,即电极间隔被设计为激发的光点中心间距与光点大小保持固定比例。由于感受野的大小随着视觉场的偏心度线性增加,而皮层放大效应则以对数方式变化,这种最佳配置在中央凹区域的电极分布比在周边区域更为疏松。结果表明,电极应在中央凹区域更为分散地布置,而不是密集排列,这与常见的直觉相反。
Ione Fine团队的模拟结果表明,过度密集的电极排列在中央凹区域并不利于提升感知分辨率。相反,基于神经生理学的约束,合理分布电极的位置和间隔,才能最大化视觉皮层假体的感知效果。
“虚拟患者”模型带来的启示
“虚拟患者”模型解决了视力恢复开发中的根本问题——植入物在植入人体之前,无法预测患者的感知体验。通过这一模型,研究人员能够在无需实际植入的情况下,预见和评估不同电极设计和刺激参数对视觉感知的影响。
此外,该模型还解释了一个关键性误区:增加电极的数量或减小电极的尺寸,并不一定会带来更好的视觉感知效果。相反,甚至可能导致感知体验的复杂化。
Ione Fine团队的模型揭示了限制皮层植入物空间分辨率的三个主要因素:皮层放大率、感受野结构和电极大小。感受野大小与皮层放大率密切相关。在大部分皮层区域,感受野面积近似于皮层放大率的负2/3次方,这解释了Bosking等人先前的观察,即患者绘制的光幻视大小可以通过皮层放大率来预测。在中央凹区域,皮层放大率达到最大值,因此感受野大小达到最小值,半径在0.02到0.5度之间。
数据和模拟结果表明,对于固定电极尺寸,光幻视的大小随偏心率线性增加。对于半径小于0.25毫米的电极,这种线性关系主要是由于感受野大小随着偏心率的增加而增大所致。只有在电极尺寸较大时,皮层放大率和受刺激的皮层范围才会显著影响光幻视的大小。
对于较小的电极,感受野的大小成为限制视觉清晰度的主要因素。如果能够选择性地刺激具有非常小感受野的神经元,那么在中央凹区域的电极间距可以更紧密,从而实现更高的空间分辨率。然而,值得注意的是,人类能够分辨极其细微的空间细节,这些细节远小于单个感受野的宽度。这些精细的空间辨别能力依赖于对具有不同感受野的神经元群体复杂反应模式的解读,而不仅仅是依靠单个神经元的感受野。
综合而言,Ione Fine团队的模拟表明,未来可预见的时期内,视觉皮层假体的空间分辨率更可能受到视觉皮层神经生理结构的限制,而非仅仅是工程技术的限制。这意味着,要提升视力恢复的效果,研究人员需要深入理解和利用视觉皮层的神经生理结构特性,而不仅仅是追求更多或更小的电极设计。
现有“虚拟患者”模型不足
“虚拟患者”模型的出现革新了医学界对视网膜植入手术的认知。虽然建模技术早已用于模拟电刺激对局部组织的影响,例如电极的电流扩散,但如果不将虚拟模型扩展到基本生理学原理,就无法预测感知结果。
Ione Fine团队的简单“虚拟患者”模型成功预测了广泛的皮层电刺激感知结果,表明它可能为未来的视网膜或视觉皮层植入物提供合理的感知结果近似值。这样一来,未来的研究方向将会有更为可靠的‘被试’数据作为研究方向的指导。
不过他们现有的模型还存在有待优化的空间。首先,目前模型使用电流幅度作为输入参数。理论上,更准确的方法是使用电流密度(电流强度除以电极面积),以更精确地反映电流在组织中的分布和作用效果。
其次,Ione Fine团队1假设电极与皮层表面齐平。在实践中,电极不太可能与表面齐平,甚至电极相对于皮层表面的轻微倾斜都可能导致仅电极边缘有效地驱动神经反应。
第三,模型应被视为一种近似模型,不适用于长时间刺激方案的推广。第四,模型未包含电场或非线性神经相互作用。第五,模型假设感知是每个感受野的简单平均值。另一种方法是假设每个神经元更适合通过其“最佳重构滤波器”来表征——即该细胞在神经群体中对自然图像重构的贡献。
最后,当前的模型仅包括V1皮层区域。由于皮层表面的构型,在较高层次的视觉区域(如V2或V3区域)植入电极要容易得多。模型中许多部分,包括从视觉空间到皮层表面的转换,都可以轻松推广到这些更高的视觉区域。模型也可以容易地扩展到包含V2或V3神经元感受野的模型。然而,V2-V3神经元感受野结构的复杂性,加上缺乏来自V2或V3电极的皮层刺激数据,意味着目前对模型的任何此类推广都是非常推测性的。
未来展望
未来这些“虚拟患者”模型可以提供多种用途。对于研究人员和公司来说,一方面,它们可以定量测试我们是否对技术有全面的理解。由于收集行为皮层数据的难度较大,模型驱动的方法能够有效地指导哪些实验能够获得最有价值的见解,优化研究资源的分配。
另一重要用途是预测给定植入物可能产生的视觉质量。在本文中,Ione Fine团队在评估不同阵列配置时依赖于对感知质量的定性评估。一种更严格的方法是关注主观可解释性:通过让视力正常的个体使用模拟的假体视觉进行感知任务。或是使用模拟作为解码器的输入图像,该解码器经过训练以生成原始输入图像的重建,最近使用的皮层模拟器就类似于更复杂模型中的一些现象。
最后,这些“虚拟患者”可以指导新技术的开发。例如,如上所述,当前的模型反直觉地表明,在中央凹区域的小电极尺寸和密集植入的优势有限。“虚拟患者”还可以用于生成深度学习基础的假体视觉优化训练集,旨在为现有植入物找到最佳刺激模式。类似的视网膜刺激模型目前正用于通过生成深度学习基础的预处理训练集,在虚拟现实环境中模拟和优化假体视觉。
对于FDA和医保等机构,这些模型可以提供评估设备时重要视觉测试的见解,帮助制定更加合理和科学的评估标准,确保新型视觉恢复技术的安全性和有效性。最后,对于外科医生和患者家庭,这些模型将提供更现实的感知结果预期。
关于追问nextquestion
关于天桥脑科学研究院
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的世界最大私人脑科学研究机构之一,围绕全球化、跨学科和青年科学家三大重点,支持脑科学研究,造福人类。
TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。