提起电磁波,总让人联想到电视机的雪花屏以及广播的沙沙声。原本强度、频率整齐的电磁波,因各种干扰变得不稳定导致视听不畅。


在电子设备中,这种不稳定电磁波形成的高能波峰,便成为 EMI(电磁干扰)对周边设备造成耗损。EMI 一直被视为电子设备的隐形杀手,相比一般使用环境及产品结构。放置在数据中心的服务器内部空间小、敏感器件多、功率密度高、配电复杂,加之成千上万台服务器一起运转,庞大数量的电子设备使 EMI 问题更加突出。


近日,新锐服务器厂商宁畅工程师,便就产品预研过程中如何解决服务器 EMI 问题公布了一种解决方案,宁畅工程师用各种办法,才将不稳定的电磁波变为“整齐”的“宁畅波”。


宁畅信息产业(北京)有限公司(简称“宁畅”)是集研发、生产、部署、运维一体的服务器厂商,及 IT 系统解决方案提供商。宁畅可结合用户需求,提供全方位深入定制化服务。


解决案例:


问题:电磁干扰达 250mV
宁畅硬件工程师测试某主板系统 100M CLK 信号有叠加 570kHz 左右的周期性脉冲,信号上下叠加干扰峰值高达 250mV,导致信号质量不符合 SI Spec 要求。图片如下:

 

 

查找原因
一、查看原理图,此信号是由 100MHz CLK 发生器经过 Buffer 输出至各 PCIe Slave 设备,测试发现 CLK3 有周期性干扰。测试 Buffer 输出其他信号,发现 CLK1 也有干扰,但是其他通道 CLK 信号此干扰很小,排除此 Buffer 芯片本身问题或芯片供电影响。


二、查看 PCB 对比 CLK 信号走线差异,CLK2 走线布在 BOT 层,CLK3 走线布在 BOT 和内层。两组信号在 BOT 层走线没有太大差异,初步排除 BOT 层干扰。经过仔细检查,CLK3 内层走线的上下两层是完整的 GND 参考层,走线间距满足手册要求,层内其他信号干扰也可排除。单独测试 GND 信号,发现有 560kHz 周期性干扰,初步定位干扰源。

 

 


三、这种低频率噪声首先怀疑来源是开关电源的 PWM 信号。


采用如下几种替代实验,来验证源头:
 

 

通过以上实验可初步判断是合路缓起芯片工作中产生的干扰通过 GND 层耦合到了 CLK 信号。


原因分析
根据合路芯片规格书,查看其内结构框图,发现其有两路输出,OUT1 输出链路没有经过 PWM 开关链路,中间只是经过一些 MOSFET,其功能主要是均流作用,不是原因所在。而 OUT2 部分没有详细框图,从其 Spec 可以得到其开关频率典型值有两个:510kHz 和 480kHz。怀疑此部分电路为干扰源。


寻找解决方案
找到源头了,接下来就要解决问题。将此问题定位为 EMI 问题,通常解决办法有 3 种:
1. 抑制干扰源;2. 切断耦合路径;3. 保护被干扰源;


实际分析、解决及验证过程:
为降低噪声和干扰,增加滤波电容是一个可选的解决途径,尝试在输入和输出增加滤波电容实验结果如下:
 

 

恢复问题板卡初始状态,将板卡安装至机壳,并通过多根粗线将板卡 GND 信号连到地。测试干扰大幅度减少,且接地线越多,干扰幅值越小,CLK 信号干扰减小到 50mV 左右,在 Spec 要求范围内,问题解决。


经验及反思
1. 在使用隔离电源的板卡中需要格外关注 EMI 问题。


2.EMI 问题解决手段有些是矛盾的,需要灵活合理利用。比如切断耦合路径需要去掉隔离电源两端的 EMI 电容,而抑制干扰源需要将 EMI 电容加上。


3. 因为测试环境与实际运行环境有些差距,导致测试结果不一定是实际运行结果,所以对部分测试结果要持怀疑态度。


4. EMI 干扰是共模干扰,单纯电容滤波难以解决。


综上所述:在面对板卡调试的各种疑难杂症时,要学会多加思考和各种尝试,穷尽所有手段,在看似各种相互矛盾的解决办法中寻找合适的方案。


5000 项测试模型助降 20%网建成本
宁畅工程师介绍,在产品设计与研发阶段阶段,宁畅服务器内的每一块硬件板卡均经过严格的板级测试流程,包括:硬件 PowerOn 测试、PI 测试、SI 测试等,每个测试环节的监测项超过 300 个,覆盖并验证所有底层设计,为产品质量保驾护航。


此外,为高效、高质量地完成客户需求的定制化服务器项目。宁畅整机测试部门,积累了 5000 项测试模型,并实现了“自动化”测试、自动在线数据采集分析等技术,全自动化测试程序将 3 至 5 日的工作缩短至 20 小时内,帮助客户降低网络建设成本 20%,提高运维效率 30%以上。


除以上测试外,为保障定制服务器产品的稳定性,宁畅产品还需经过抗振动测试、抗干扰测试、碰撞测试、温湿度测试、耐腐蚀等近百项稳定性测试与优化。
 

图说:宁畅 2U 双路机架服务器 R620,历经上千项测试与优化