header
嵌入式 > 电路设计 > 详情

设计工程:为什么调试时间总是比预期的长?

发布时间:2020-05-25 发布时间:
|

  在大多数情况下,我的实验室工作主要是对一个组件或系统进行特性分析或验证。但是,当碰到设计团队遇到非常难解决的重大问题,当他们的设计不能运行的时候,我偶尔也会去到某个实验室。

  现在,我不介意DUT始终不工作的情况。(在这种情况下,失败的)根本原因是可重现的,并且通常是显而易见的原因。让我觉得痛苦的一种情况是,客户对我说:“系统会间歇性地锁定”。

  在上个月的某一天下午我就遇到了这样的事。也许让你了解我们调试这一系统所采取的步骤和在此过程中学到的经验会是件有趣的事。

  第1课:当我听到“偶尔失效”或“就在我说话的时候发生了”这样的话时,首先要做的第一件事情是拿起电话,重新安排我第二天晚上的航班,再预定一个房间并确定会在晚一点的时候登记入住。

  在安排好第二天晚上的行程后,接下来就要去了解被测的设备出了什么问题。

  第2课:当你开始调试的时候,客户的板卡是从来不会有任何问题的。问题总是出在我的测试设备上—“我觉得问题在于你的设备有漏洞或其它问题。”

  下一步是将排除DUT中的模块或子系统存在故障。我们使用的方法是更换子系统,直到我们找到发生故障的单元。经过2小时的折腾,在更换处理器板、DSP加速器模块、自定义显示屏ASIC、内存DIMM、电源、连接器和电缆后,问题…..依然存在,只是故障发生的频率没有那么频繁了。

  第3课:有时,问题在于防火墙,而不是硬件。在经过仔细研究操作手册之后,我们下载补丁、对FPGA重新编程,然后,哇,系统锁定的情况也好转了。

  再回到更换模块。当我们用黄金参考模块换掉参考时钟分频模块后,问题消失了。

  第4课:许多高速连接器不能接受重复性地插入和拔出。

  下一步是要让DUT的时钟分频模块持续失败,这样我们才可能找到根本原因。我们无法再直接仿真模块,因为它有自己的晶体振荡器,并且实验室没有温控烘箱。因此,对它用的是冷、热风枪。好消息:随着PLL分频计数器的温度升高,故障重新出现!

  坏消息和第5课:热风枪是设计用于回流焊接剂的,不能用其取代温控烘箱。

  在找到合适的技术资源来取代BGA之后,已经是吃晚饭的时间了。并且我们不用走很远。如果你晚上9点后呆在实验室,小吃和饮料都是免费的!

  第6课:巴甫洛夫是对的---将食物作为一种奖励。

  既然我们不能再重复强迫故障发生,那我们现在必须要物理性地探测各个时钟节点,并重复操作以捕获故障的发生。[page]

  第7课:VCO不喜欢你把任何探针放到其输出端。

  在对进行Gerber文件一番侦探后,我们终于找到了底层表面通道的某个相位检测器的输入端,通过一个小小的手术,我们将能够获取这一信号!

  教训7: X-Actos不只是方便从实验室排除干扰处理类型。

  采用示波器高波形捕获率的DPX模式,我们现在能够捕获来自时钟分频电路的间歇性的周期变化(见图片)。顾客:“我们发现了问题所在,这很不错,但我们如何将其与正确的分频器隔离开?”

  第8课:仅发现问题还不够,还必须把问题解决。

  既然我们知道时钟周期发生了变化,我们只要简单用示波器上的高级脉冲宽度触发模式即可重复捕捉到这一误差。造成问题的根本原因是,采用了降低成本的重新设计,电源滤波用并联电容被具有更大并联电感的低成本电容所取代。抗电源(干扰)不足会导致VCO控制节点电压在内存子系统执行MSB转换时上下浮动,。

  当我在午夜后抵达酒店,他们已经把我的房间给别人住了。

  第9课:如果酒店认为你(预定了房间)却一定不会来,他们就会将给你预定的房间转给其它人。



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
技术文章--PCB EMC设计的关键因素
footer