【作者:杜晨;编辑:VickyXiao;题图来源:英特尔;源自: 硅星人《首次公开:世界最神秘的半导体生产设计基地,向我们打开了大门》2022.09】
从设计,到生产,到测试、调整、再生产,到最后的出厂和面市,一枚小小的芯片,要经历一个复杂而又漫长的流程。
对于这些流程,许多半导体从业者都能如数家珍。然而,极少有人能够真正进入全世界最顶级、最高机密的晶圆工厂,以及装备了最尖端技术设备的芯片测试实验室,以最近的距离,亲眼目睹一枚芯片的诞生全过程。
没跟你夸张:别说客户进不去,就连在全球十二万员工的英特尔自己,也只有1-2%左右的员工能够出入它的芯片生产车间;99%的员工甚至没有机会和晶圆拍一张合影。
而在今天,难掩自豪的硅星人终于可以说,我们不仅和 Raptor Lake 晶圆(即将发布的13代酷睿处理器)合过影,还是穿着无尘车间的“兔子服”:
图片来源:硅星人 via 英特尔
在这张照片被拍下的10分钟前,我刚刚从英特尔以色列 Fab 28 晶圆工厂出来。这家可以和“芯片技术创新”划等号的全球顶级半导体公司,在前不久终于对来自十多个国家的分析师,首次敞开了它久富盛名的晶圆厂大门。
图片来源:硅星人 via 英特尔
别嫌弃我们没见过世面:对于任何科技从业者,这都称得上是“一生难得”的机会。就连 YouTube 科技类顶流大号 Linus Tech Tips,在参观之后都高呼:"I can die now."(注:这里的 die 是个双关,还有晶粒的意思。)
好东西没道理独享。接下来,冲一杯咖啡,开一包零食,跟硅星人共同走进英特尔以色列 Fab 28 晶圆厂以及 IDC 芯片测试实验室,一探究竟吧。
/ 进入工厂 /
Fab 28 是英特尔历史上建立的第一座非美国本土晶圆厂,于1996年落成,坐落在以色列迦特镇 (Kiryat Gat)。
巴以地区饱受战乱,一般人会感觉在这里建厂不太安全。然而真实情况是:考虑到人才储备、政策优势、军工科技的滴漏效应等因素,英特尔早在1974年就来这里建立了以色列设计中心 IDC(后改名为以色列研发中心 IDC)。而把工厂和研发中心放在一起,是符合逻辑的做法。
后来,英特尔在耶路撒冷建立了 Fab 8,再后来又在迦特镇建立了 Fab 28。 直到今天,该工厂仍然是酷睿处理器的主要生产地,对于英特尔意义非凡。
Fab 28 主体办公楼 图片来源:杜晨/硅星人
Fab 28 无尘车间所在的大楼远景 图片来源:杜晨/硅星人
而正如前文提到,在所有英特尔员工当中,能够进入到工厂生产环境,甚至无尘车间的少之又少。这不,刚一进入大楼,没走几步,就看到了“保护区域”(protected area) 的警示牌,意思是这些区域的办公室和工作环境可能高度涉密:
Fab 28 无尘车间所在的大楼远景 图片来源:杜晨/硅星人
在正式进入 Fab 28 晶圆厂无尘车间之前,我们首先见到了 Daniel Benatar,英特尔全球芯片生产的总负责人。他介绍了这次在 Fab 28 能够亲眼见到的芯片生产关键过程,包括离子注入 (implant)、扩散 (diffusion)、光刻、蚀刻 (etch)、薄膜、平坦化 (planarization)、受控折叠芯片连接 (C4) 等
Daniel Benatar 讲解晶体管电路设计的变化 图片来源:硅星人 via 英特尔
/ 第一站: 无尘化 /
参观正式开始,我所在的一组的“导游”是 Fab 28 工厂经理 Oren Cohen。在他的带领下,我们在办公楼里来回穿梭,上楼下楼几次,终于来到了洁净室/无尘车间 (Cleanroom) 的入口。这里有一道安检门,只有得到授权的员工才可以刷卡进入。
图片来源:Linus Tech Tips
为了避免携带污染物物,所有人在进入无尘车间之前都必须穿上外号“兔子服”(bunny suit) 的防护服。然而在穿上兔子服之前,我们首先要戴上鞋套、头套、胡须套,和布手套。
这个区域并不是完全无尘,但已经采用了和无尘车间相同的加压单向空气流通系统:它的气压比外面办公区域更高,高度净化过的空气自上方吹入,从下方吸走,这样一切可能漂浮在空中的污染物都可以被尽快捕捉。
然后我们进入下一个区域,穿上正经的兔子服。这个区域的气压又比前一个更高,结果就是距离真正的无尘车间越近,空气越干净,污染物越少。兔子服一共四件:头罩、连体衣、鞋罩和乳胶手套。同行者也要互相帮助检查穿戴覆盖是否完整。
但实际上兔子服保护的并不是我们,而是车间里的设备和晶圆/芯片本身。
这些生产资料对于污染极其敏感,任何颗粒物都有可能废掉一整张硅片。整个 Fab 28 一年364天7×24小时不间断工作,产量极大。如果环境不够清洁,哪怕一分钟的污染暴露就足以累计上百万美元的损失。进而为了清洁和维修工作而暂时停工,会进一步扩大损失。
这也是为什么英特尔对于清洁的要求如此之高:每立方米颗粒物数不得高于1(手术室要求只有3万左右)。
甚至这个区域内使用的所有工具,都必须实现无尘化。工作人员“没收”了我的笔记本,然后发给了我一套专门在无尘车间里使用的纸和笔……因为它们采用的是特殊纸张和油墨,不容易产生静电和纤维、颗粒物脱落。
图片来源:杜晨/硅星人
/ 到处都是机器人 /
穿好兔子服,完成无尘化之后,我们终于正式进入了 Fab 28 的无尘车间。这里的气压是整栋楼里最高的。
从画面中你也许能够看到一点“泛黄”,这是因为入口区域直接和车间的光刻 (Litho) 部门相连。一般的白光其实是多种光的复合,会对晶圆造成影响,所以光刻部门区域都会采用纯粹无影响的黄光:
图片来源:硅星人 via 英特尔
刚一走进车间,我们惊讶地发现:就在头顶不到一米的上方,一台台大福 (Daifuku) 机器人正在沿着轨道来回穿梭。
这些机器人携带的黑色“货物”叫做 FOUP——前开式统一处理盒 (Front Opening Unified Pod)。FOUP 的作用,是在工厂的各个区域和部门,成百上千台各种功能的设备之间运输宝贵的晶圆。
机器人用机械臂抓住一台 FOUP 图片来源:硅星人 via 英特尔
每台 FOUP 最大容量25张晶圆 图片来源:硅星人 via 英特尔
下面两张图是对机器与 FOUP 接口处的拍摄,可以看到双方的机械臂可以互相配合,安全地抓取和放置晶圆,确保在运输过程中对晶圆品质造成的影响最小化:
图片来源:硅星人 via 英特尔
图片来源:硅星人 via 英特尔
FOUP 所运行的轨道,在英特尔内部称为“自动超级高速”(ASH),遍布整个车间。在任何一个“路口”抬头看,一眼都能看到至少7、8台机器人。整个工厂到底有多少台 FOUP?英特尔并没有回答,只是透露有“上千”台。
值得注意的是,FOUP 不仅可以在无尘和有尘区域中间运行,英特尔还正在 Fab 28 旁边修建一座更大规模的晶圆厂 Fab 38,届时两座工厂之间也会用 ASH 轨道进行连接,一张硅片可能先在28进行离子注入,又被飞速运到38完成光刻,再运回来……
图片来源:硅星人 via 英特尔
/ 无尘车间逛一遍 /
整个车间面积达到了4个美式橄榄球场,装满了各种机器,完成各式任务。仅我肉眼能够看到的设备里,来自应材、ASML、东京电子等全球五大半导体设备商的产品,在这里已经齐聚一堂。
在参观过程中,工作人员一再提醒我们:不要乱按按钮,不要靠在机器上面,甚至连摸都不让摸……这是因为芯片生产的精度要求极高,任何意外触碰都有可能产生振动,甚至机器移位,导致生产缺陷或机器故障。事实上,包括 Fab 28 在内,英特尔在全球的数十家晶圆厂都坐落在地壳运动相对更稳定的地区,车间内一些高精密的机器也直接安装在抗震板上面。
前面看完了天上飞来飞去的 FOUP 之后,下一站我们来到了缺陷应对部门。
只要工厂在运转,缺陷应对部门就不下班。他们的工作是一年364天×24小时不间断应付生产过程中出现的各种缺陷,评估缺陷的原因,如果是遇到过的话,就利用已经制定的应对手段立即处理。如果是前所未有的缺陷,那么现场工程师会把各项数据记录下来,立即组织团队研究原因,尽快研究开发出新的应对手段。
电子显微工程师 Shai Perets 向我们介绍,这也是为什么缺陷应对团队被称为“梦之队”,因为这项工作的全称是 DREAM - defect reduction evaluation and methods (缺陷降低评估和方法)——不仅检测缺陷,还要设计开发避免缺陷、提高良率的方法和技术。
整个厂内的工程师团队工作方式也比较特别,通常分为现场和远程两组。以“梦之队”为例,有人在楼下车间现场收集数据、完成操作;楼上办公区的指挥中心里,还有一个专门的办公室,里面坐满了一群对芯片诞生全流程都足够了解的“全能型”工程师,负责缺陷分析工作。
英特尔把这些现场工程师比喻为“宇航员”,而楼上的工程师则是“休斯顿地面控制中心”。
缺陷应对部门指挥中心的团队 图片来源:硅星人 via 英特尔
下一站,我们来到了光刻部门。
在车间现场,我们看到了应目前市面已知最先进的36nm极限分辨率的光刻机。 工程师 Batz Kleiz 告诉我,光刻部门主要采用的设备来自 ASML、东京电子等企业。每台机器的成本都高达数千万美元,而考虑到车间的面积就达到了4个橄榄球场……可想而知这座工厂有多值钱。
一家晶圆厂的光刻部门 图片来源:硅星人 via 英特尔
一组流水线包括光刻、涂膜、显影等多种功能机器,晶圆在这些机器之间来回传递。大部分情况下机器之间可以直接在密闭接口完成交换,有时候则要用到前面提到的 FOUP 对晶圆进行“长距离转移”。
Kleiz 表示,经过多年的光刻生产流程优化,现在流水线的出片速度非常之快。尽管具体数字无法透露,整个 Fab 28 光刻工艺每分钟出片已经达到了“四位数”。
英特尔还想演示一下,当机器出了故障到底该怎么办。
英特尔以色列有一个特殊人才计划“Ofek Darom”,不看教育背景和出身,只要好学、真诚、有驱动力,哪怕是农民也可以“转职”芯片工程师。但是这样也带来了一个问题,就是新手每次“出外勤”还要老师傅带新人,不仅麻烦,学习成本也高。
而在最近几年,英特尔在包括 Fab 28 在内的全球许多工厂里都开始用上了 AR 教学。新手工程师戴上 HoloLens 头显,可以直接在现场观看 AR 教程,里面会教你每种工具放在工具箱什么位置,某个螺丝应该拧多少圈,按钮先按哪个后按哪个等等。
这些 AR 教程和工具,工程师可以随时随地自己编写。英特尔表示自从采用了 AR 技术来辅助培训之后,员工上手的速度快了很多。目前仅在无尘车间里就有至少150名来自于“Ofek Darom”计划的工程师,只用三年时间就完成了训练,能够正常独立完成各项工作。
图片来源:Linus Tech Tips
因为机器实在太多了,长得又都差不多,工作人员发现在车间里特别容易迷路,而且有些维修工作非常紧急,精神高度集中,反而会找错机器,造成不必要的损失。
于是,除了给车间里的每一条路,每一个路口,每一台机器都进行了编号之外,英特尔还给机器加上了【颜色+动物】的视觉标识,比如“蓝蝎子”、“红犀牛”、“绿斑马”,这样一来有效降低了工程师在紧张工作的时候出错的概率。
整个参观的无尘车间部分,到这里告一段落。再给大家放几张车间里的照片吧,毕竟一般人很难进去:
图片来源:硅星人 via 英特尔
英特尔对降低缺陷提高质量的追求,可以被下面这句话所体现:Every die wants to live——每一枚晶粒都想活下来。
下图可以注意地面的绿色带孔地板,整个无尘车间包括配套区域采用的都是加压单向空气流通:清洁无尘的空气从上方喷出,从地板吸走,越接近无尘车间气压越大。
这个系统也是一年365天24小时运转,每20秒就可以把整个车间的空气全都置换一遍。
图片来源:硅星人 via 英特尔
工作人员假装擦拭设备,其实因为整个区域太干净,完全用不着。 图片来源:硅星人 via 英特尔
走出了无尘车间,我们把进来时的流程倒着走一遍,脱掉一身的防护装备。这一趟不是很热,但是有点憋,主要是防护服、口罩、眼镜、乳胶手套都不透气,因为仪器工作要求车间里空调又不能开太冷(实感28°C)。
所以终于出来脱掉兔子服的时候,整个人呼吸都更顺畅了——这也让我由衷钦佩那些一整年的每天大部分时候都要呆在车间里的英特尔员工……
值得注意的是,FOUP 不仅可以在无尘和有尘区域中间运行,英特尔还正在 Fab 28 旁边旁边修建 Fab 38,届时轨道将会把两座工厂串在一起,FOUP 和机器人都可以来回穿行。
从车间一出来,紧接着我们就被带到了旁边的停车楼楼顶。这里正好可以看到旁边正在建设中的 Fab 38 工地。
Fab 38,代号“Sparrow”,是英特尔在 Fab 28 的旁边修建的一座新晶圆厂,面积差不多(原话“还是4个美式橄榄球场”),但整体技术水平更加先进,耗资超过10亿美元。
由于 Fab 38 采用了特殊的房顶设计,需要一座极其巨大的起重机才能够吊起组成房顶的一节钢架。
于是英特尔找来了比利时起重巨头 Sarens,在 Fab 38 工地上组装一台 SGC 系列巨型起重机。这将是目前为止全球第二大起重机,吊钩载重达到了惊人的2850吨。(第一大在慕尼黑,客户也是英特尔)仅为了组装这台起重机都要用到4台塔吊,花费至少一个季度。
图片来源:硅星人 via 英特尔
而且整个工程实在太大,需要的水泥太多,以至于英特尔直接在工地旁边修建了自己的水泥厂。
Fab 28 代表的是英特尔的今天,而 Fab 38 将会代表这家芯片巨头的未来。
落成启用后,Fab 38 预计将主要采用更新的 RibbonFET + PowerVia 技术来取代“过时”的 FinFET 晶体管工艺,用于生产 Intel 4、3、20A 等未来制程产品,并且成为近两年公司力推的代工服务战略 IDM 2.0 的基地之一,从而更好地服务亚洲和欧洲的代工客户。
/ IDC 芯片测试实验室 /
上世纪70年代美国半导体人才严重短缺,英特尔召回了公司早期员工、EPROM 技术的发明者多夫·福罗曼 (Dov Frohman),满足了他返回故土以色列创办高科技研究中心的夙愿,让他在海法创办了 IDC。最初 D 字代表设计 (design),后来全面升级为研发 (development)。
IDC 大楼 图片来源:硅星人 via 英特尔
这次我的以色列行程,除了 Fab 28 之外的另一站就是位于 IDC 的芯片测试实验室。对于英特尔来说,芯片测试并不是从产线上随机抽个样,装到主板上看下能不能开机——整个测试流程非常复杂,要求严苛,而且该公司的指标是“每一枚出厂的芯片都必须经过测试”(流程不尽相同)。
为此英特尔在 IDC 大楼内修建了一座巨大的、迷宫一般的芯片测试实验室,包括开机、验证、游戏、跑分、外设兼容、极端环境稳定性等多项测试内容。甚至当芯片出现故障的时候,这里还有一个神秘的“芯片手术室”,有一组身份对外保密的工程师在里面,对芯片进行纳米级微创手术……
另外在前面提到的 IDM 2.0 战略之下,英特尔还为包括微软、戴尔、联想等在内的 Windows 设备品牌提供测试服务,这些测试工作也是在 IDC 的实验室环境下进行的。
这些测试工作不仅由 IDC 员工完成,每次有新一代芯片问世时,来自全球各地的设计师、工程师都会参与。
IDC 走廊 图片来源:硅星人 via 英特尔
接下来正式进入芯片测试实验室。我们的第一站是开机房 (power-on room)。
简单来说,芯片设计师首先做出纸面设计,然后交到晶圆厂“打样”,花费几周到几个月不等的时间生产出 ES1(工程师样本)芯片。出厂之后,测试样品的第一环节就是开机。
然后是验证实验室 (validation lab)。在这里,英特尔会进一步对芯片的各项子系统(集成显卡、逻辑、内存、连通性、兼容性)进行深入的验证测试。
由于英特尔需要在这里运行数百甚至上千台测试机,整个验证实验室的占地面积也很大。这样做的原因是测试工作不能随便抽几张芯片进行,必须实现规模化。
图片来源:硅星人 via 英特尔
验证实验室 图片来源:硅星人 via 英特尔
图片来源:硅星人 via 英特尔
验证测试环节会采用一些市面在售的硬盘、内存、显卡等。但为了更好地测试芯片对于还未普及的新技术的兼容性,工作人员也会自主设计一些高度定制化的主板、PCIe 模拟卡、USB 外设模拟设备等。
比如,测试用的主板就不是市售的,而是英特尔自主设计,名为“参考验证平台” (RVP),里面的功能和配置都可以通过远程遥控来实现,省的工程师还要跑来跑去进行调试。
再比如下图中的这张看起来有点像显卡的东西:其实它是第一台采用 PCIe 5.0 的设备,是英特尔的测试工程师为了测试新芯片(包括12和即将发布的13代酷睿)的 PCIe 5.0 兼容性,而专门自己设计的 FPGA(由 Altera 生产)。
PCIe 5.0 测试用 FPGA 图片来源:硅星人 via 英特尔
你可以把这张卡看成是一个“超级模拟器”,它能够模拟显卡、存储、内存、网络等各种各样的设备,但它更重要的作用是监控并记录测试对象芯片对于 PCIe 5.0 设备的控制性能表现。并且由于它是一台 FPGA,工程师可以轻松地使用 DIP 开关以及重新编程的方式来快速修改它的功能和性能——也即调节测试当中的变量。
除了这张 FPGA 卡之外,英特尔还自主开发了很多灵活调节的测试装备。比如测试视频输出,CPU 集成显卡需要支持多显示器,但是在实验室里每台试验台都装一堆显示器太占地方了,于是英特尔开发了一个像是 U 盘一样的装置,能够模拟多台显示器插入的状态,直接插在主板上就行了。
下面这个东西也是英特尔自己攒出来的,专门测试各种 USB-C 接口的性能。大家知道 C 口支持的 USB 版本、传输协议、功能非常多,相当混乱,买错线/转接头是常有的事。而英特尔希望能够确保芯片在尽可能多的情况下设备都能够正常工作,于是设计了这么一个能够模拟各种传输协议、菊花链等情况。
图片来源:Linus Tech Tips
以及下图红色管道的装置:这并不是什么 CPU 风扇/AIO 之类的东西,它正式的名字是液压气动冷却系统 (HPCS),也可以叫热管 (thermal head),作用是模拟各种可能出现的温度变化情况,比如冷启变热、热启变冷、急热急冷等,从而确保最终芯片在各种情况下都能够保持可靠性能。
图片来源:硅星人 via 英特尔
既然是芯片测试实验室,如果测出了问题该怎么办?
答案当然是送去检修了。而这些最重要的工作,都在地下的 debug 实验室完成。
最后,我们来到了 debug 实验室。这里的工程师的任务是根据楼上汇报的问题找到问题究竟出在在哪里,确认原因,并且试图通过各种不同的方式来进行修复,然后将修复结果交给设计师,让他们去重新修改芯片的设计。
一位 debug 工程师告诉我,按理来说,如果自己的设计师同事都在认真无误地工作,他们应该是失业的……不过现实情况并非如此,在指甲盖大小的一块晶粒上,可能要分到几十甚至上百设计师,每人负责一个区块。而在区块之间,很可能因为电路的顺序搞错了,而导致芯片无法正常工作,“在我们这再正常不过了。”
而且,一年到头出 bug 的概率还是挺小的,所以这支 debug 工程师团队也并不大(当天在办公室里的就五个人)。
麻雀虽小,五脏俱全。debug 部门拥有我在整个芯片测试实验室里见到的最酷的装备。
图中右侧的 LADA 机器,能够用高功率激光改变芯片工作原理 图片来源:硅星人 via 英特尔
首先是下面这台机器,它的名字叫做 LADA,全称“激光辅助期间改变”(laser-assisted device alteration)。比方说 debug 团队发现了芯片中的某根晶体管出现了问题,想要验证一下修改建议是否有效——只需要把芯片放到这台机器下方,用超高精度和高功率的激光对芯片的指向部位进行照射,就可以修改那根晶体管的属性,从而改变芯片的工作方式。
LADA 机器 图片来源:Linus Tech Tips
图片来源:Linus Tech Tips
而如果激光也不能完全解决问题,需要对芯片动手术,怎么办?
我被带进了一个更神秘的房间:
图片来源:硅星人 via 英特尔
房间中间的机器名为 FIB,也即聚焦离子束 (focused ion beam)。这台机器真的堪称芯片的手术台:它先用激光对已经封装好的芯片进行烧灼。在封盖上切出一个微米级别的“创口”,然后再用 FIB 对芯片上的电路进行亚微米级别的“修改”。
英特尔没有透露公司一共有多少 FIB 工程师,只是表示达到该公司要求的技术操作级别的操作员,在全世界可能也就两位数。
图片来源:硅星人 via 英特尔
以下图为例:离子束能够在极微小的电路上架设出新的桥梁,把设计错误的电路用正确的方式连接起来。用 FIB 技术对芯片进行物理修改,能够减少设计方案修改次数,加速方案的验证流程,最终缩短芯片研发时间和周期,确保满足英特尔对于一代芯片24-36个月不等的研发周期 deadline。
图片来源:硅星人 via 英特尔
以上就是这次硅星人对英特尔 Fab 28 和 IDC 芯片测试实验室的访问记录。
这次访问是英特尔在以色列举办的 Intel Technology Tour (ITT) 的一部分,共有来自全球十多个国家的数十位分析师参加。ITT 议程还包括即将发布的13代酷睿芯片的 demo等更多新技术和产品。
更多 Fab 28 及 IDC 照片:
测试中的(13代酷睿?)芯片 图片来源:硅星人 via 英特尔
图片来源:硅星人 via 英特尔
图片来源:硅星人 via 英特尔
来自第三方公司的工作人员正在测试13代酷睿超频性能 图片来源:硅星人 via 英特尔
我们在行程中还见到了 Arik Shemer。他是一位芯片debug工程师,和许多以色列早期员工一样也是从美国“返乡”的,1978年开始工作,至今已经44年,在公司内部现职员工年份里却只能排到前30。
不过他很自豪地表示,当年经常拍电报发邮件(不是email)联络的同事兼朋友 Pat Gelsinger,如今已经成为了公司的 CEO……
图片来源:硅星人 via 英特尔