我曾在一家光通信公司担任设计工程师,该公司生产的1000台设备安装在世界各地。现场的模块很多,送回公司返修的也很多,我的工作便是搞清这些模块出了什么故障。其中一次故障查找经历给我上了精彩的一课,我至今记忆犹新。
客户寄回来一个模块,其故障原因很容易找到:一个烧焦的钽电容。这个电容短路了,导致价值数万美元的模块无法运行。这种表面贴装电容器(7343封装,额定电压为20V)贴装在12Vdc电源层上。这段时间内,大约10,000个电容器中只有一个电容器出现故障,这一数据大大低于根据统计数据 预测的故障率。我给这颗烧焦的电容拍了照片,把这个案子结了。
几周后,另一个客户又退回了一个类似的模块,在这个模块的同一位置,一颗电容器烧焦并短路了。即便算上这个模块,故障率仍然低于统计预测值。我知道板子上还有5颗相同的电容器,它们并联在同一个12Vdc电源层上。除了模块的故障率,现在板子上电容的故障率是六分之一。所以,我又拍了一张照片。虽然我写了一份报告来安抚高层管理人员,但我觉得最好还是进行一下可靠性计算,尤其是钽电容器的可靠性,越快越好。
过了几周,我又收到了一个故障模块。还是相同的电容器,看起来很糟。那时我已经完成了可靠性计算,对可靠性进行长篇大论的复杂解释可能会吓倒其他人,但为什么烧毁的总是相同的电容器?过电压?尖峰电压?都不太可能。同一个12Vdc电源层上有很多灵敏器件,在电容器甚至还没有感觉之前这些器件就会被烧毁。除了过大的纹波电流,我想不到其它更好的解释。
这三颗烧毁的电容器显示出一个共性,即它们的负极端子上几乎都没有焊锡,这让我产生了这样的想法:电容器出现故障是由于纹波电流导致温度升高而引起的。电气连接仍然良好,但是焊锡很少。电容器的正极端子良好,上面有大量球形焊锡。缺乏焊料会导致热接触受阻,但这只是我的一个想法而已。我计算了最差的纹波电流:最大额定值的10%。在操作板上,我发现纹波电流不到5%。
我排除了其他可能的原因——从湿度过大到涡流。这时,我突然想起了PCB的布局图片。这5个没有发生故障的电容器的布局是相同的:过孔靠近两个端子并向下通往内部层。而发生故障的那颗电容器的正极端子上有一个过孔,但在负极端子上,有一条较粗的走线进入电容器下方的焊垫内,然后再到外部。这时,我知道问题出在哪了。
正极端子上的焊锡处于它应该在的位置,将端子紧紧地压到PCB上。但是,在负极端子这边,在组装过程中,熔化的焊锡流到电容器下方然后凝固,这抬高了负极端子,使电容器发生弯曲而产生微小的裂纹——众所周知这是电容器的天敌。我激动不已,第二天写好了技术分析报告。
(原文刊登于Aspencore旗下EDN英文网站,参考链接:A bad-capacitor story ends happily,由Jenny Liao编译。)