光模块行业专题报告:降本降耗趋势显著,聚焦技术创新

(报告出品方/作者:开源证券,任浪、张越)
1、 倚靠半导体工业而生,算力时代下降本降耗趋势愈发凸显
1.1、 内部结构解析:基于 IC 工艺,围绕 TOSA/ROSA 构建的光电转化 体系
光通信器件指应用于光通信领域的光电子器件以及配套集成电路。光通信器件 按照在信息流中的不同作用可以分为五大类,包括光信号的产生、调制、传输、处 理以及探测。光收发模块在信息流中对应着光信号的产生、调制和探测;光分路器 和光放大器对应着信号处理。光通信器件按照物理形态的不同分为芯片、光有源器 件、光无源器件、光模块与子系统四类。其中有源光收发模块的产值在光通信器件 中占比最高,其性能主导着光通信网络的升级换代。
光模块是实现光信号输入过程中光电转换和电光转换功能的光电子器件。所有信息通信信号初始状态都是电信号(模拟/数字),否则 IC 芯片无法处理。要实现光 纤通信,信号发射端需要将电信号转换为光信号,通过光纤传输到远端。信号接收 端,光探测器接收到光信号,并转化成可处理的电信号。光模块可按照速率、距离、 封装方式等多种类型进行分类。从封装来看,光模块有多种封装形式,适配不同尺 寸、功耗和速率需求。目前光模块的封装以可插拔形式为主,具备小尺寸、低功耗 的优势,部分长距高速相干领域追求高性能,仍采用不可插拔形式。随着交换容量 增大、端口密度变大、功耗增加等挑战日益严峻,LPO/CPO 成为行业重要的技术创 新。
图片
光模块的结构使得其具备光电转换的功能。光模块通常由光发射器件(TOSA, 含激光器)、光接受器件(ROSA,含光探测器)、功能电路、光(电)接口、导热架、 金属外壳等部分组成。从发射端来看,驱动芯片对原始电信号进行处理,然后驱动 半导体激光器(LD)发射出调制光信号;从接受端来看,光信号进入接收端端后, 由光探测二极管(PD)转变为电信号,经前置放大器后输出。功能电路集成了时钟、 数据恢复芯片以及激光器驱动芯片等。
电芯片、主控芯片、TOSA、ROSA 在光/电转换过程中起着重要的作用。以 4x25Gps 光模块通信方案为例,通过 MCU 控制芯片与电接口利用 I2C 引脚进行数据 交互,将 4 路速率高达 25Gbps 的电信号传送给时钟和数据恢复芯片 CDR;然后 MCU 控制芯片将经过 CDR 处理后的 4 路电信号发送给驱动激光器,使得 4 通道的驱动激 光器能够驱动 TOSA 组件,从而让 TOSA 组件发出一路速率为 100Gbps 的光信号; 通过光纤传输达到光接口的 100Gbps 光信号进入到 ROSA 组件中;MCU 控制芯片与 电接口进行数据交换,让 ROSA 组件将这一路 100Gbps 光信号转换成 4 路 25Gbps的电信号发送给 TIA;TIA 将这 4 路电流信号处理成一定幅度的电压信号,经过 CDR 处理后通过电接口输出。
(1)微控制单元 MCU
MCU 是主打控制功能的单片机,负责对光模块的芯片进行调控。MCU 把 CPU 的频率与规格做适当缩减,并将内存、计数器 (Timer)、USB、A/D 转换、UART、 PLC、DMA 等周边接口,甚至 LCD 驱动电路都整合在单一芯片上,形成芯片级的 计算机。CPU 内核通过存储器的程序控制外设,外设通过中断系统联系 CPU 内核, 二者通过总线传输信号、数据以及地址等信息。存储器通常包括 ROM 和 RAM,外 设部分包括串口控制模块、SPI 模块、I2C 模块、A/D 模块等。
MCU 的工作原理是逐条执行预存指令的过程,不同类型的单片机有不同的指令 系统。为了让一个单片功能自动完成某项具体任务,需要将所要解决的问题编成一 系列的指令,并且这些指令必须是由一个单独的函数来识别和执行的。一系列指令 的集合就变成了程序,这些程序需要预先储存在内存中。MCU 在执行程序时要将这 些指令逐个提取并执行,必须拥有能够跟踪指令所在存储单元的功能,这个部分就 是程序计数器 PC。当程序开始运行时,PC 将会被分配到程序中每一条指令的存储 单元,并一一执行该项指令。PC 中的内容自动增加,增加量由这个指令长度决定, 每一条都指向下一条指令的起始地址,保证指令顺序执行。
(2)通用数字信号处理器 DSP
DSP 相对 MCU 更侧重于运算和数字信号处理,而 MCU 侧重于多种数据的处理控制。DSP 的实时运行速度可达每秒数千万条复杂程序指令,比 16 位 MCU 单指 令执行时间快 8-10 倍。DSP 为了提高信号处理算法的效率,加入了很多指令,在设 计结构上将数据总线和地址总线分开,使程序和数据分别存储在两个空间。 DSP 在光模块中的作用是对模拟信号进行采样、量化,把模拟信号转换成数字 信号,去除光纤链路中的色度色散、偏振模色散,完成载波频偏估计、载波相位恢 复等功能,具有强大的信号恢复能力,但是成本较高、延迟大、功耗高、发热明显。 随着工艺节点逐步变薄,DSP 芯片的设计成本愈发高昂。2020 年 7nm 产品推出时, DSP 芯片设计成本已达 2.5 亿美元左右;预计 5nm 节点时,芯片设计成本将达到 4.5 亿美元。在高资本投入的背景下,市场竞争格局向寡头垄断演化,目前全球份额主 要集中于 Inphi、Broadcom 以及华为海思三家。功耗方面,由于 DSP 引入了 ADC 与 算法,功耗远高于传统的 CDR 芯片。以 400G 光模块为例,其所用 7nm DSP 功耗约 为 4W,占模块整体功耗的 50%。而 DSP 降低功耗的方法有限,主要依赖于流片工 艺的提升。
图片
DSP 技术是相干通信的重要支撑,是其产业化应用的基础。当光传输速率达到 50G 以上,光纤偏振模色散影响加剧,严重影响链路有效传播距离与信号质量,此 时 DSP 对抗和补偿作用就愈发凸显。而传统的非相干通信通过光路补偿器件进行色 散补偿,其效果远差于 DSP。DSP 技术的成熟导入,省去了系统中原有的色散补偿 模块,使得长距离传输的链路设计更加简单,降低传输成本。
相干和非相干光通信的核心区别在于发送端使用的调制方式以及接收端使用的 检测方式。调制方式方面,相干通信更加多元化,增强了信息的承载能力。非相干 采取简单的强度调制方式,通过电流大小改变激光强度产生 0-1。而相干系统借助外 调制的方式,可以进行频率调制或相位调制,如 PSK、QPSK 等,拓展了信息传输 的容量。检测端,相干通信直接在接收端对微弱的信号进行混频放大,而非相干则 依赖于在传输过程中使用大量的放大器。相干通信利用一束本振光与输入信号光在 混频器中混频,得到与信号光频率、相位和振幅按相同规律变化的中频信号,实现 信号的放大。由于本振光的功率远大于信号光功率,因此经过相干混合后的输出光 电流大幅增加,提升了检测的灵敏度。凭借更加多元的调制方式以及 DSP 技术的应 用等,相干光通信具有传输距离远、传输容量大的优势,应用场景包括 DCI 互联、 5G 中回传以及城域网等。
(3)时钟和数据恢复芯片 CDR
CDR 在光模块中的主要作用是从接收到的信号中提取出数据序列,并且恢复出 与数据序列相对应的时钟时序信号,从而还原接收到的具体信息。时钟数据恢复主 要完成两个工作,分别是时钟恢复和数据重定时,让接收端的信号与发射端信号保 持一致。在光互连场景中,当单通道数据速率达到 25G 时,无论是在接收端和发射 端都需要采用 CDR 电路从高损耗的信号里恢复出高质量的数据,再通过驱动电路将 数据加载到光波上。 CDR 的基本组成部分包括鉴相器、电荷泵(CP)、环路滤波器、压控振荡器(VCO) 等。通常 CDR 是一个有振荡器的反馈环路,通过环路调节振荡时钟的相位来跟踪输 入数据中的嵌入时钟。鉴相器通过用 VCO 的输出时钟对输入数据进行采样来获得控 制信号,控制信号输出到电荷泵产生控制电压来调节 VCO 的振荡频率。由此恢复高 质量的时钟信号和数据。CDR 带宽是 CDR 的重要指标,主要影响光模块的数据锁 定时间、抖动指标,在一定程度上决定着光模块的关键性能。若 CDR 带宽的取值较 大,光模块的数据锁定时间则较短,但是抖动性能会变差;若 CDR 带宽的取值较小, 此时抖动性能会变好,但是锁定时间会变长,甚至会导致个别系统单板上数据失锁。
(4)激光器驱动(调制)器 LDD
激光器驱动(调制)器的“驱动”体现在为激光器提供电流,同时对电流进行 调制,把 1010的信号用有光无光或光的幅度/相位来表征。LDD 将 CDR 的输出信号, 转换成对应的调制信号,驱动激光器发光。根据调制方式的不同,可以划分为外调 制(EML)和直接调制(DML)。直接调制下,通过电路里的开关直接控制电流的 开通和关断,激光器的光功率和驱动电流呈正比。其优点是结构简单、体积小、工 艺难度低等,但缺点是带宽的利用率较低,并且会有特殊的啁啾效应,难以应用于 长距离传输。外调制将电路开关移动至激光器外面,主要有 EA 电吸收和 MZ(马 赫-曾德尔调制)两种方式。MZ 是调制发射光的相位,电吸收则是通过材料完成调 制功能。外调制能够有效解决激光器的啁啾效应,可用于骨干网长距离传输。
图片
直调通过输入端的电压 0-1 信号控制开关切换,从而完成电信号向光信号的转 换。在直接调制的 LDD 中存在两个电流源,分别是控制平均光功率的偏置电流源和 控制消光比 ER 的调制电流源。当调制信号为 1 时,输入到激光器的电流为偏置电流 和调制电流源,电流大,激光器的输出振幅大、能量高。当调制信号为 0 时,流过 激光器的电流是偏置电流,电流小,光强度较弱。 直接调制结构在短距离传输时具有优势,但出于调制带宽的限制不太适应于高 速率长距离的传输。直接调制通过直接注入电流来实现信号调制,注入电流的大小 会改变激光器有源区的折射率,造成波长漂移从而产生色散,限制了传输距离。并且直接调制的带宽有限,调制电流过大时激光器容易饱和,难以实现较高的消光比。
(5)光发射组件 TOSA
TOSA 主要由激光器(LD)、光隔离器、耦合透镜、MPD、多路复用器(MUX) 等构成。激光器驱动器将电信号发送给 LD,LD 将电信号转换为光信号后通过光隔 离器、透镜等光器件,将光信号耦合至光纤中,实现电光信号转换。为了节约成本, MPD、隔离器和 MUX 不是必备项,其中 MUX 仅在需要波分复用的光模块中搭载。
LD 的发光原理依赖于二极管的异质结构。LD 由本征、P 型和 N 型半导体组成。 N 型半导体掺杂了 5 价原子,自由电子数量多于空穴;P 型半导体掺杂了 3 价原子, 空穴数量多于自由电子,是多数载流子。在 P 区和 N 区之间会形成一个空间电荷区, 即 PN 结。基于材料的发光特性,LD 主要使用砷化镓掺杂构成。普通二极管的半导 体层多由砷化镓或者硅半导体掺杂组成,但由于硅二极管在能量的复合过程中释放 的不是光,因此 LD 主要为砷化镓二极管。LD 产生相干光束的原理是光吸收、光自 发发射以及光受激发射三种现象。当 LD 被外部能源刺激时,自由电子会从 N 层移 动到 P 层。一部分直接与低能级的价电子相互左右,使价电子受激到高能级状态。 另一部分与低能级的空穴复合,释放光子。光通过 LD 反射端溢出形成窄光束激光。
LD 按照出光结构可进一步分为面发射芯片和边发射(EEL)芯片。面发射芯片 包括 VCSEL 芯片,边发射芯片包括 FP、DFB 和 EML 芯片。EEL 在芯片两侧镀光 学膜形成谐振腔,光子经谐振腔选模放大后,将沿平行于衬底表面的方向形成激光, 最终激光从侧面发出。VCSEL 在芯片上下两面镀光学膜形成谐振腔,腔体与衬底垂 直,光子经选膜放大后垂直于芯片表面发射激光。谐振腔主要起到储存、提纯激光的作用,通常由两块反射镜构成,也可以用耦合器构成各种环形谐振腔。光子在反 射镜之间来回反射,不断在增益介质中引起受激辐射,产生高强度的激光。
FP 主要应用于低速率短距离传输,结构和制造工艺简单,成本较低。DFB 以 FP 为基础,布拉格光栅集成到激光器内部的有源层中,在谐振腔内形成选模结构, 实现单纵模输出,主要用于高速中长距离传输。EML 集成了 EAM(光吸收调制器) 和 DFB,属于外调制激光器,具有大调制带宽、低频率啁啾的特点,更好地解决了 色散的问题,信息传输质量高,能够实现高速率长距离传输。
衡量 TOSA 性能的主要参数为光发射功率和消光比。发射光功率影响信号传输 距离。激光器将电信号转换为光信号,用 MUX 复用器合波成一束高速光信号,通过 适配器传输至发射光纤,该光信号的强度为光功率。光功率越高,表明发射机性能 越好,光信号能传输更远的距离。消光比影响误码率。TOSA 发出的光信号有两种 状态:逻辑 1 为高光功率,逻辑 0 为低光功率,消光比为高电平的平均功率与低电 平的平均功率比值。消光比越大,在接收端就能更好的区分 0、1 电平,从而接收到 的光信号质量就越好。
(6)光接收组件 ROSA
光接收组件(ROSA)主要由 PD(Photo Diode)、TIA(跨阻放大器)、LA(限 幅放大器)、耦合透镜、光学接口、电气接口以及金属外购组成。解复用器 DEMUX 将收集的光信号进行分波处理,不同波长的光将会被 PD 转换为电信号,再经过 TIA 和 LA 放大整型后发送给外部控制芯片。由于 PD 产生的电流较小,需要利用 TIA 将其输出的电流放大成功能电压,方便后续的电信号处理。TIA 因接收的电流大小不 同,导致电压的增幅值不同,为了保证后续电信号的稳定,需要通过 LA 进行信号整 形,将 TIA 输出的不同幅值电压处理成等幅的电压信号。 根据 PD 结构的差异,可以进一步划分为 PIN 和 APD 型光电探测器。PIN 二极 管通过在 P 型和 N 型半导体之间增加一层轻掺杂的 N 型本征层,以展宽耗尽层,提 高转换效率。APD 相较 PIN 具有更高的接收灵敏度。通过在 PIN 二极管结构中增加 雪崩区,使得光生载流子以碰撞电离的方式在其耗尽区内激发出新的电子-空穴对, 新产生的载流子通过内电场加速,导致更多的碰撞电离产生,最终获得雪崩效应。
衡量 ROSA 性能的核心指标是灵敏度和接收光功率。灵敏度。保证误码仪在一 定误码的条件下,接收端所能接收到的最小光功率称为灵敏度。在高速率传输中, 灵敏度越小,光模块性能越强。接收光功率。在一定的误码条件下,接收端能够接 收到从光源发出光信号的强度,称为接收端光信号。 从成本角度来看,光模块成本受光/电芯片以及控制芯片的影响较高。根据华拓 光通信的数据,光器件占光模块成本的比重为 73%,具体包括光器件元件(46%) 和 DFB/APD 芯片(27%)。控制芯片占光模块成本的比重为 18%,仅次于光器件。 光器件的成本结构中,DFB 占比最高,达 48%;其次为 APD/TIA,合计占比 32%。
图片
1.2、 算力时代下光模块降本降耗趋势凸显
数据中心的高能耗问题由来已久,算力背景下该问题愈显突出。工信部数据显 示,2023 年我国数据中心耗电量预计将达到 2,667.92 亿千瓦时,占社会总耗电量的 3%。在此背景下我国多地区发布了对数据中心能效指标 PUE 的限制。在工信部印发 的《新型数据中心发展三年行动计划(2021-2023 年)》中要求,到 2023 年底新建大 型及以上数据中心 PUE 需降低到 1.3 以下。算力需求提升带动网络带宽成倍提速, 数据中心能耗呈指数型增长。根据 Digital Information World 发布的最新报告,数据 中心为训练 AI 模型产生的能耗将为常规云工作的三倍。据咨询机构 Tirias Research 建模预测,到 2028 年数据中心功耗将接近 4250MW,比 2023 年增加 212 倍,数据 中心基础设施加上运营成本总额或超 760 亿美元。
数据中心的能耗主要体现在 IT 设备和制冷设备。IT 设备主要包括服务器和网络 设备等。服务器承载了计算和存储业务,搭载了 CPU、内存等硬件。网络设备包括 交换机、路由器以及防火墙等。IT 设备占数据中心整体的能耗达 45%,其次为制冷 系统,占比达 43%。具体到 IT 设备,其中服务器类约占 50%左右,存储系统约占 35%,网络通信设备约占 15%。
数据中心带宽提升,带动高性能交换芯片和高速率光模块的应用。数据中心交换芯片的演变趋势基本处于每两年翻一番的快速增长,25.6T 交换芯片用 7nm 工艺, 51.2T 则需要选择 5nm 工艺节点,预计 2025 年 3nm 工艺节点可实现,并支持交换芯 片实现 102.4T 的容量。对于光接口而言,25.6T 交换芯片对应 64 个 400G 光模块, 已于 2021 年实现。2023 年随着 64 个 800G 模块的推出,支持交换机升级到 51.2T。 对于 102.T 的交换容量,则需要 1.6T 光模块,光口每波长速率达到 200G。
高性能交换芯片和光模块的使用导致网络设备功耗大幅增加。光模块速率的提 升带来功耗大幅增加。400G 早期功耗为 10-12w,预计长期功耗为 8-10w,800G 功 耗约为 16w。以英伟达 QM9700 交换机为例,具有 64 个 400G 端口,若满载光模块, 单台交换机对应的功耗就高达 640w 以上。
图片
交换芯片数据吞吐量提升带动 SerDes 速率的提升,SerDes 功耗也呈上升趋势。 SerDes 是网络设备的核心器件,负责光模块和网络交换芯片的连接。将交换芯片输 出的并行数据,转换成串行数据进行传输。在接收端,再将串行数据转换成并行数 据。在 102.4Tbps 时代,SerDes 速率需要达到 224G,芯片 SerDes 功耗预计会达到 300W。受 PCB 材料工艺的限制,当 SerDes 速率增加时,为了保障信号的高质量传 输,信号传输距离将会相应缩短。当 SerDes 速率达到 224G 时,最多只能支持 5-6 英寸的传输距离,这使得交换芯片和光模块之间的封装距离需要进一步缩短。 综上所述,AI 算力的发展导致高性能交换芯片、高速率 SerDes 及光模块的渗 透率加速提升,带来数据中心网络设备的功耗大幅提升。设备厂商 Cisco 的数据显 示,2010-2022 年全球数据中心的网络交换带宽提升了 80 倍,背后的代价是交换芯 片功耗提升约 8 倍,光模块功耗提升 26 倍,交换芯片 SerDes 功耗提升 25 倍。
除了网络设备功耗大幅提升,服务器的散热功耗也非常可观。根据 CCID 数据 统计,2019 年中国数据中心能耗中,约有 43%是用于 IT 设备的散热,基本与 45% 的 IT 设备自身的能耗持平。服务器散热需求带动液冷行业的发展。引入液冷,可以 降低数据中心能近 90%的散热能耗。数据中心整体能耗,则可下降近 36%。 在光模块降本降耗的发展趋势下,行业围绕驱动器、调制器、激光器以及电接 口四个方面去降低功耗。驱动器方面,如果采用线性驱动 LPO 技术路线,则可在数 据链路中只使用线性模拟元件,无需 DSP 或者 CDR 芯片,从而降低 DSP/CDR 产生 的功耗。调制器方面,薄膜铌酸锂基于其自身较低的半波电压,使得其相对于其他 材料的调制器所需要的驱动电压更小,从而具备优越的低功耗特性,成为产业界尝 试解决调制器功耗问题的重要途径。激光器方面,主要有提高激光器电光效率以及 提高耦合效率两种途径。Lumentum 于 22 年 OFC 会议提出 CW 激光器解决方案,使 用 SI-BH 结构,通过 DFB+SOA 来提高光功率,前端有 SSC 模斑转换用于降低发散 角、提高耦合效率。电接口方面,缩短交换芯片和光引擎之间的连接长度,采用诸 如 NPO 和 CPO 之类的超密集封装,实现更高密度的高速端口,提升整机的带宽密 度。而 NPO/CPO 背后的技术,即为硅光技术,以光子和电子为信息载体的硅基光电 子大规模集成技术。
2、 LPO 线性直驱:有望在短距离场景下发挥潜力
LPO 是基于 linear Driver 芯片技术实现的可插拔光模块,是对含有 DSP 设计 的高速热插拔以太网模块的优化和改进。目前主流的 200G/400G/800G 产品是基于 PAM4 技术加上 DSP 芯片来实现高速、高调制信号的恢复和传输。DSP 作为高速数 字处理芯片,能够实现信号的恢复,降低误码率,同时还可以进行色散补偿、去除 噪声以及非线性干扰等因素。但是成本较高、延时大、功耗高且发热非常明显。LPO 通过使用性能提升的 TIA、Driver 芯片,实现更好的线性度,剔除高速率可插拔模 块携带的 DSP,带来模块功耗下降,但是在系统误码率和传输距离方面有所牺牲。
信号在交换机主芯片和光模块之间的传输会产生损耗,高频损耗大于低频损耗。 交换机主芯片和光模块之间的信号传输通过 PCB 板上的铜线进行。“趋肤效应”使 得金属线在传输过程中存在自然的损耗。加入 DFE、CDR 等“非线性”模块能对电 信号进行修补整形,降低损耗的影响,DSP 凭借数字算法能将补偿效果做到最优。 DSP 将模拟信号转化为数字量进行处理,最大程度地对信号进行整形补偿,但是结 果是带来非线性工作量提升,功耗和延时随之增加。LPO“降耗”的思路是将信号 非线性的修复功能交给交换机系统侧来实现,光模块自身仅保留 CTLE。连续时间 线性均衡器 CTLE 对由于通道特性而衰减的信号进行增强,支持 DC 以及 AC 增益。
图片
LPO 技术路线的主要壁垒在于电芯片,应用场景局限于短距离连接场景。目前 全球主要的电芯片厂商为 Macom、Semtech 以及美信。由于 LPO 牺牲了 DSP 的高性 能信号恢复能力,因此应用场景主要限于短距离(50m 内)的连接场景,比如数据中心中服务器和架顶交换机之间的连接。随着 800G 高速率光模块需求的增长,LPO 凭借在功耗以及成本方面的优势有望取得市场需求的增益。更高线性度的 TIA/Driver 给 LPO 带来信号整形能力的提升,在交换芯片侧使用更高性能的 DSP 有望降低信号 在链路上传输的损耗。 目前国内的布局LPO的厂商主要为剑桥科技和新易盛,海外主要厂商为Macom、 Semtech、Maxim 以及 Broadcom。(1)剑桥科技方面,公司与电芯片龙头厂商 Macom 建立了良好的供应链合作关系,预计 2023 年下半年首批基于硅光的 LPO400G/800G 实现小批量出货。剑桥科技与英思嘉共同推出的 LPO 400G 光模块方案基于硅光技 术的 MZ 驱动器 ISG-D5640H 和基于 EML 技术的驱动器 ISG-5640E,适用于 400G DR4/800G DR8 的应用场景。(2)新易盛方面,公司于 2023 年 3 月 ODC 期间推出 了 800G LPO 产品系列,用于单模或多模的场景。
3、 CPO:超高速场景下的颠覆性技术,海外龙头布局领先
光芯片通常采用Ⅲ-Ⅴ族化合物 InP 和 GaAs 作为衬底材料,不同的材料体系由 于物理效应差别较大,导致最终器件的功能也有所差异。衡量衬底材料特性的因素 主要包括器件密度、波导损耗、无源器件、有源器件、是否可集成光源以及成本。 器件密度决定了光芯片的尺寸,密度越高,集成度越大。有源/无源器件在某些材料 体系下加工困难。光源方面,III-V 族直接带隙半导体材料具有优势,可以在单个芯 片上直接集成光源。成本方面,硅材料成本最低,其他材料的价格较为昂贵。
硅材料集成度高材料成本低,但在制备激光器方面难度较大,III-V 族材料成本 高与 CMOS 工艺兼容较差,铌酸锂集成度低但光电系数高。硅光子技术是将电子器 件、光子器件和光波导回路集成在同一硅基底上。优势在于相干调制以及合分波器件的高度集成化,解决相干产品的缺陷,进而下沉到核心与汇聚层。当前硅光体系 已能够实现大部分无源和有源光器件,仅在硅基光源和光放大器方面还面临困难。 目前硅基光源主要采用混合集成的方式,或者将一个外部的激光器倒装在硅芯片上, 也可以采用外延生长的方式在硅上生长 III-V 族材料。InP/GaAs 自发光效应好,主要 用作制备激光器,目前主流光模块基本采用 InP 光芯片,但材料成本较高。铌酸锂 通常采用质子交换法或钛扩散方法制备。由于铌酸锂电光系数较高,所以在调制器 中的应用广泛。其相对其他材料最大的优势在于,能够高效率地进行频率转换。
InP 芯片的加工流程主要分为四步,分别为外延生长、波导刻蚀、表面平整化 以及金属互联。(1)外延生长。InP 芯片的波导层以外延的方式生长。外延通常分为 三步,先生长有源层 active layer,再生长无源层 passive layer,最后生长 P 型掺杂的 InP 覆盖层。工艺难度在于如何控制好外延生长的均匀性,使得波导层损耗低、射频 工作性能好。不同于 InP 芯片,硅光芯片从 SOI 晶片开始,直接对 220nm 的 Si 层刻 蚀形成波导;(2)波导刻蚀。通过干刻的方法刻蚀外延层,制备出不同类型的波导。 根据刻蚀的深度可以划分为深刻蚀、浅刻蚀以及刻蚀到波导层上方的包层。InP 体系 的波导主要为脊形,结合外延生长的有源层,就可以制备成光放大器、调制器、探 测器等有源器件;(3)表面平整化。在波导之间的空隙中填充材料,使整体结构稳 定;(4)金属互联。在平整化后的表面生长电极,用于有源器件的外部信号输入。
国内厂商主要参与 InP 芯片产业链的后段模组制造环节,设计、晶圆代工以及 封装供应商主要集中于海外。磷化铟晶圆是整个链条的前段;磷化铟晶圆生产出来后,在此基础上涂材料实现“外延”后提供给了芯片商;然后在制造商手中成为光 器件,在设备商手上被研制成为光系统。
对比全球主要代工厂加工的光芯片性能,硅光与 InP 各有利弊。波导传输损耗 方面,两种材料体系相差不大,都在 1-3 dB/cm 之间;调制器方面,硅光的带宽更大, 但是插损高于 InP;探测器方面,硅光带宽更高,但是响应率低于 InP。 硅光是提高集成度、实现重复性生产的关键。根据全球主要代工厂的数据,硅 光单位面积的流片成本相对 InP 没有体现出优势,尽管硅光的原材料成本以及晶圆 价格较低于 InP。其主要是受工艺的成熟度、封装难度以及生产良率的影响。但 InP 在晶圆尺寸上较大,单片 MPW 的流片数量较少,集成度方面存在劣势。硅光的成 本优势有望在规模化后体现出来。硅光与 CMOS 工艺相兼容,有望充分利用硅制造 技术的规模、成本和工艺控制等优势。在 AI 的推动下,数据中心对光模块的需求量 预计大幅提升,硅光有望迎来新的产业化机遇,受到部分云计算厂商的青睐。
图片
随着行业对低功耗、低成本、高集成度光模块的需求愈发旺盛,硅光凭借更低 的材料成本,更高的集成度成为重要的技术研发方向。根据 Equnix 预测,以一个拥 有超过 10万台服务器和 5万多个交换机的数据中心为例,它们之间的连接需要超 100 万个光模块,花费在 1.5 亿美元至 2.5 亿美元之间,占据数据中心网络成本的 60%, 超过交换机、NIC 和电缆等设备的总和。硅光模块虽然工艺难度大,封装成本较高(约 1.5-2 美元/GB),但其成本理论上有望降至 0.3 美元/GB,在规模量产情况下发挥成本 优势。 CPO 的出现主要是为了解决高频电链接距离的问题。数据中心带宽的增长导致 SerDes 速率不断提升,功耗随之增加。为了保障信号的高质量传输,优化 SerDes 功 耗,信号传输距离将会相应缩短,即交换芯片和光模块之间的封装距离需要进一步 缩短。除此之外,随着数据中心内部流量的不断增长,每根光纤的传输容量也在不 断提升,而数据中心光纤的单芯容量只有 100-400G,要做到大规模的数据吞吐意味 着需要不断增加通道的数量,CPO 可以提高集成度。根据数据显示,通过采用 CPO 技术,光学连接所需的功率有望降低 50%以上。
CPO 作为新型光电子集成技术,基于先进封装技术将光收发模块和控制运算的 ASIC 芯片异构集成在一个封装体内,形成具有一定功能的微系统。先进封装技术是 一种采用先进的设计思路和先进的集成工艺技术,如硅通孔、重布线, 、倒装、凸点、 引线键合等对芯片进行封装级重构,能有效提升功能密度。下游行业对高容量(更 多通道更高速率)、低能耗、低成本、可靠性的追求,带动光模块的光电互连封装技 术不断创新演化。从最初的 AOC 有源光缆、可插拔光模块,到 PCB 板载光模块, 到如今广泛探讨的 CPO 封装,都是在适应不断增长的数据量要求。
按照物理结构 CPO可分为 3 种技术形态:2D平面 CPO、2.5D CPO 和 3D CPO。
(1)2D 封装
基于 2D 封装的 CPO 技术是将 PIC 和集成电路并排放置在基板或 PCB 上,通过引线或基板布线实现互连。2D 封装的优点是易于封装、灵活性高,EIC 和 PIC 都 可以使用不同的材料、利用不同的工艺单独制作。根据芯片和基板互连方式不同, 基于 2D 封装发展出了基于 Wire bonding 的 CPO、基于倒装的 CPO、基于扇出型晶 圆级封装技术的 CPO 三种技术路径。台积电在 2021 年推出了紧凑型通用光子引擎 COUPE 技术,将 EIC 和 PIC 放置在同一基板上,通过引线键合的方式在基板上实现 互连。Acacia 于 2017 年利用 CPO 技术设计了一款相干模块,将 PIC、驱动器芯片 和 TIA 倒装焊在一个 11 层的低温共烧陶瓷基板上,相对于 PCB 大大节省空间。信 号通过陶瓷基板内部走线互连,具有较短的路径和良好的电学性能,相比于在 PCB 上走线大幅减少了传输损耗。
图片
(2)基于 2.5D 封装的 CPO 技术
2.5D 封装是将 EIC 和 PIC 均倒装在中介层(interposer)上,通过 interposer 上的金属互连 PIC 和 EIC,interposer 再与下方的封装基板或 PCB 板相连。根据所 用转接板的材料不同,基于 2.5D 封装发展出了基于玻璃转接板的 CPO、基于硅转接 板的 CPO 和基于嵌入式多芯片互连桥接三种技术路线。 玻璃材料由于具有高透光性、低损耗的电气互连特性和出色的尺寸稳定性,很 适合作为 CPO 的转接板。硅转接板采用硅晶圆加工技术,可以制作更小线宽的互连 线,布线密度高,可以实现光电芯片的高密度引脚互连。美满科技在 2022 年推出了 一款基于 2.5D CPO 技术的交换机,它将驱动芯片、TIA、激光器等倒装在有 TSV 的 硅光转接板上,再将转接板和 DSP 放到同一块有机基板上形成光引擎,然后将 16 个光引擎和交换芯片 Marvell Teralynx7 在 PCB 上互连形成交换机,可达到 12.8Tbps 的交换速率。2017 年新加坡微电子所基于 2.5D 硅转接板 CPO 技术实现了多通道硅 基集成光模块,电芯片和光芯片倒装在硅基转接板上,再通过引线键合与下面的 PCB 实现互连。该模块实现了单通道超过 50G 的传输速率,通过多通道实现了超过 400G 的速率。
(3)基于 3D 封装的 CPO 技术
3D 封装技术通过将光电芯片进行垂直互连,可以实现更短的互连距离、更高的 互连密度、更好的高频性能、更低的功耗、更高的集成度以及更紧凑的封装,是目 前 CPO 技术研究的热点和趋势。 2022 年博通首次推出了一款基于 3D 封装的光引擎,它将 PIC 倒装在 EIC 上方, EIC 与 ASIC 芯片通过基板互连。将 25.6Tbps 的 Tomahawk 4 交换机芯片和 4 个 CPO 结构的光引擎封装在一起形成一个交换机,单个 CPO 模块支持 3.2Tbps,整个系统 包含 4 个 CPO 模块,共有 12.8Tbps 的带宽。博通称采用 CPO 的结构可以节约 40% 的功耗和 40%的每比特成本。
CPO 目前处于产业化初期,在工艺、仿真以及测试等方面面临很多技术挑战。 封装工艺能力是制约 CPO 发展的重要因素,涉及 TSV、TGV 等多种先进复杂的封 装技术,每一种技术都皆有利弊,需要在研发制造过程中不断探寻最可靠的方案。 以 TSV 通孔加工技术为例,其涉及深反应离子刻蚀工艺。在采用氟化物对硅刻蚀后, 需要对通孔进行电镀填充,填充步骤是该技术的关键和核心。电镀填充的材料包括 铜和银,一方面需要控制填充速度,以防止后期形成孔洞,另一方面还需要控制填 充后的表面铜层厚度,以减少后续平坦化工艺的难度。整体工艺流程在可靠性和良 率方面难度较高,国内相关制成水平与海外存在较大的差距。
散热问题对于 CPO 来说具有重大挑战。CPO 中放置光和电器件的空间十分狭 小,并且光学器件对热特别敏感。在 CPO 标准工作组所做的模拟仿真中,在风速 5m/s 的条件下,当采用 16 个的 CPO 模块和一个开关芯片模型设计时,开关芯片的温度为 151.76℃,几乎无法正常工作。 主流的热可插拔模块在维修时非常方便,但作为不可插拔的 CPO 封装技术在维 修时难度较高,因此测试、良率以及可靠性问题成为 CPO 产业化的关键。由于光芯 片是直接与电芯片通过先进封装工艺封装在一起的,如果某颗芯片发生了损坏,整 个模块就无法正常工作,这不仅使良率下降,也给测试带来了诸多困难。CPO 的光 学器件具有不同于以往开发的任何子组件的通道密度,这意味着现有的测试解决方 案不能满足测试要求。可靠性要求具体包括使用寿命、故障率等方面,提高产品可 靠性可以大幅降低后续 CPO 的维护成本。 2020 年以来 CPO 逐渐从学术型研究成果转变为市场需求的产品。如英特尔、 博通、美满科技等行业内龙头企业均已推出多款基于 CPO 的量产产品,其他企业也 在积极地布局相关产品,并推进 CPO 技术标准化。云服务厂商 Facebook 和 Microsoft 创建了 CPO 联盟,旨在打造一个平台吸引各细分行业龙头企业加入联盟,推动 CPO 标准的建立和产品的发展。
与国外相比,我国企业则普遍较晚进入 CPO 领域,在产品开发进度及技术研究 方面存在明显的差距。CCITA 牵头的 CPO 标准是当前我国唯一原生的 CPO 技术标 准,其目的是结合目前国内外在光互连技术发展及应用场景的差异,联合国内光模 块、光收发芯片、电驱动放大芯片、光源、连接器等厂商,共同打造更加适合我国 的 CPO 标准。光迅科技、中际旭创、华工科技、新易盛、阿里云、通宇通讯、海信、 博创科技、联特科技等都已开始涉足光电共封领域,但由于起步较晚,目前还没有 CPO 相关的产品推向市场,主要产品还都集中在 400G、800G 的硅光模块。
图片
4、 薄膜 LiNbO3 调制器:高速率场景下结合硅光或大有可为
铌酸锂的优点是响应速度快、电光系数高,适合做高速光调制器。铌酸锂这一 特性源于其特殊的电光晶体结构。当施加电压时,在泡克尔斯效应下铌酸锂由单轴 晶体转变为双轴晶体,因此电场可以大幅改变其光的折射率和相位,产生良好的电 光调制效果。传统的铌酸锂调制器受限于工艺水平,尺寸相对 InP 和硅光较大,在 行业趋向小型化高集成的背景下开始为 InP 和硅材料调制器所替代。调制电压的大 小取决于调制器调制臂的厚度和长度,而厚度和长度决定了铌酸锂调制器结构的大 小。想实现较低的调制电压驱动,就需要降低厚度或者加长调制臂的长度。铌酸锂 调制器厚度的降低由工艺所决定,在厚度达到工艺极限的情况下为了降低电压只能 选择加长调制臂。
薄膜铌酸锂可通过 smart-cut 技术来制备,从而解决传统铌酸锂调制器体积过大 的问题。为了从晶圆上得到铌酸锂薄膜,需要先使用 He 离子束轰击铌酸锂晶圆,控 制注入的力度使得离子在距离晶圆表面适当的位置停留下来。完成离子注入后,再 将铌酸锂 wafer 倒置扣在其他衬底的表面进行真空键合,加热后注入的离子散发,铌 酸锂晶体上的薄层就渗入到硅衬底的表面。
通过薄膜铌酸锂材料的低损伤干法刻蚀工艺、硅与铌酸锂薄膜大面积键合工艺、 硅和铌酸锂光波导的高效耦合方法以及大带宽行波电极的设计等关键技术,制备的 薄膜铌酸锂调制器具有成本低、尺寸小、可批量化生产、CMOS 工艺兼容等优点, 有望成为未来高速率场景下有竞争力的解决方案,目前国内还处于科研阶段,离产 业化还有距离。 华中科技大学总结了薄膜铌酸锂目前面临的两个主要挑战。首先是低成本制备 工艺。薄膜铌酸锂目前成本较高,而商用后的市场需求与单位成本息息相关。如何 解决产业化后的成本问题是关键。其次是铌酸锂的晶圆尺寸。目前以 4 吋和 6 吋为 主,8 吋和 12 吋能否实现产业化与后期的成本相关。 光库科技走在国内薄膜铌酸锂的产业化前沿。2019 年公司通过收购 Lumentum 铌酸锂系列高速调制器产品线相关资产切入赛道。公司开发的新一代薄膜铌酸锂光 子集成技术,具有高速率、低功耗等优势。目前正重点开发 800G 及以上的薄膜铌酸 锂相干和非相干调制器产品。预计将在未来几年推出薄膜铌酸锂高速调制器和模块 系列产品,传输速率或达 800G 以上。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。