广告

荒谬!把手机死机问题归咎于宇宙射线根本不靠谱

2017-02-24 赵明灿 阅读:
把手机死机的现象归咎于带电粒子引起的单粒子翻转效应——听起来很有文化,但若稍加研究,这其实经不起推敲!

前两天,某科技媒体发表了一篇题为《真相了!电脑手机卡死的原因竟然是宇宙射线干扰》的文章。该文说,计算机宕机或手机卡死时,用户不要急于谴责相关厂商——造成计算机宕机或手机卡死的真正罪魁祸首可能是宇宙射线,或者它们生成的带电粒子。真相还是谬论?笔者想要说,这恐怕是子虚乌有!1yiednc

该文把手机死机的现象归咎于带电粒子引起的单粒子翻转效应——听起来很有文化,但若稍加研究,这其实经不起推敲!1yiednc

文章所说的“单粒子效应(Single Event Effect)”这个话题早已不是什么新鲜事了。它指的是宇宙中单个高能粒子射入半导体器件灵敏区,使器件逻辑状态翻转的现象。然而要注意呢,这可是在“宇宙”中!1yiednc

宇宙射线到达地表已微乎其微,对智能手机不构成威胁

知乎上早年有一则关于“宇宙射线对计算机讯号传递的错误率有多大影响?”的问题,看起来对现在的智能手机同样适用。1yiednc

在该问题的回答中,知乎网友呆涛指出,任何形式的辐射,都会伤害无保护的ASIC电路。方式多种多样,最终目的无非一个:以电离、撞击等方式,导致软错误,也即可以纠正的、不影响硬件本身的错误。其中,单事件错误(SEE)是这里面主要的参量。严重的,甚至会导致硬件本身损坏(硬错误),也即不可修复的错误。1yiednc

那么怎么知道我这个电路会不会这样呢?标准方法叫做单次事件测试,即用一束已知能量的粒子(alpha射线、beta射线、中字束等等任何粒子)去轰击测试芯片,同时进行外部操作,看最终结果会不会翻转。粒子束的强度统一以入射粒子的能量,linear energy transfer,LET来记。具体到数量级上的话,太空设备比普通的家用计算机要高出几个数量级!原因是家里面的电脑由于地球母亲磁场和大气层的保护,基本不会受到轰击。设计的时候,设计师们都表示呵呵呵呵谁要管你。1yiednc

同时,知乎网友太初有为也指出,空间辐照主要考虑有这样几个影响:总剂量效应和单粒子效应。总剂量效应是一个类似电子迁移一样的累积过程,比如会造成一个反相器的翻转电压降低,最后不能工作。这个效应在地球上基本不必考虑,一是因为到达地球大气层的高能粒子数量较少,第二大部分电子器件的寿命没有设计得过长。但是在空间就不一定了,在空间环境里长期的粒子能量积累,最终会造成器件的损伤。1yiednc

其次是单粒子效应。单粒子效应就是指一个高能粒子打穿CMOS的某些敏感区域,造成器件的失效。这种失效有硬失效和软失效。硬失效一般表现为闩锁。闩锁的现象就是器件电流突然增大,最终被烧毁。闩锁就是CMOS中衬底和阱之间的pnpn结被导通,最终形成一个正反馈回路。闩锁在地面也会发生,但不一定是高能粒子造成的,也有可能是相邻两个cell靠的比较近产生互感。这个一般芯片设计商在设计的时候都会考虑这个效应,但是不会细致到考虑高能粒子击穿器件那个地步。所以闩锁在地面会发生,但几率不大,即使发生了也不一定会烧毁器件(闩锁在某些条件下是可以退出的),属于小概率事件。1yiednc

然后,单粒子效应还会造成软失效,就是所谓单粒子翻转或单粒子脉冲。单粒子脉冲的发生也是需要高能粒子打在cmos器件上,然后形成一个毛刺,这个毛刺如果运气好,可以被下一级的DFF吸收掉,运气不好,正打在DFF的建立保持时间窗内,寄存器就翻转了。最可怕的是打在时钟树的根节点上,那就会造成大面积的寄存器错误翻转。即使被打中,这个会不会造成bug也是个概率问题,假设打中了某个通用寄存器,但是这个寄存器可能不会被使用,或下一拍就被刷新了,那就和没打中一样。除了单粒子脉冲,还有单粒子翻转,这个发生的粒子能量阈值条件是最低的,因此是软失效中最常见的现象。这种软失效不一定会由宇宙射线造成,在地球上发生的几率也很大。但是针对软失效,芯片厂家会在硬件上进行加固,比如增加ECC校验。1yiednc

知乎另一网友沈忱则认为,对于地面应用,引起单粒子效应的辐射源,更有可能是芯片封装材料里的放射性同位素在alpha衰变中放出的alpha粒子,而不是宇宙射线。在没有充分证据的情况下怪罪老天,会遭天遣的。1yiednc

地面设备因为单粒子效应出现软错误,并不是什么新鲜事。2001年底,Sun公司的UltraSparc高端服务器出现无规律的死机,就是缓存芯片里的软错误造成的。等到几个月后Sun公司找到原因并更开始换出问题的缓存时,这个事件已经对Sun的信誉造成了无可挽回的负面影响。2004年,Xilinx公司的部分FPGA芯片也出过类似的单粒子效应问题。这两次事件都是由于芯片封装材料中的放射性同位素引起的,和宇宙射线没啥关系。如下图所示,出问题的Xilinx FPGA芯片采用了倒封装工艺,Flip-Chip焊球距离晶片上的晶体管有源区只有几个微米的距离。焊锡(铅锡合金)中的微量放射性同位素会发生alpha衰变。例如,同位素钋210(铅210的衰变产物)会发射5.3MeV的alpha粒子,并衰变成铅206。这个alpha粒子会在电路中产生单粒子效应,引起软错误。 1yiednc

002SEE20170223

来源:Xilinx White Paper 208(2004)1yiednc

1yiednc

另外,他补充,宇宙射线在一般的地面应用中是可以忽略不计的。在空间应用中,通常也是比较关注beta/gamma射线对总剂量效应的贡献,而一般不考虑它们对软错误的直接贡献。其他辐射环境下的beta/gamma射线,有其他效应。1yiednc

知乎网友yx huang也认为,这只是对于航天有影响,说宇宙射线其实绝大多数是太阳射线。
太空中具体的错误率数据不知道,在平常环境里几乎不可能碰见这种问题,前阵子听的一个电路可靠性分析报告给的总错误率是十的负几十次方per bit per cycle(包括射线等等种种因素的总错误率),总之在一台电脑的整个生命周期里面都很难见到一次。1yiednc

但在外太空就是另一回事了,上去的芯片得做防辐射加固。1yiednc

另外,知乎上还有另一个问题“微信上传的‘今晚关机,不然宇宙射线伤害’什么的,是真的吗?”,从网友刘泽坤对这个问题的回答中(如下),我们也能反观得出,要是真有这样强烈的宇宙射线会频繁引起我们的手机死机,那我们人类还能在地球上安然无恙么?!1yiednc

“只有你的手机在大气层外的时候高能宇宙射线才有可能影响到你的手机....并且就算高能宇宙射线影响了你的手机...它也无法通过手机对周边生物造成伤害....1yiednc

并且听原文描述的“极度危险的、高辐射的宇宙射线”感觉说的似乎是伽马射线暴啊...如果真是的话那就不用担心了...第一伽马射线暴是光速...是无法预测的...第二如果地球真被伽马射线暴扫到的话...全人类会瞬间暴死...加上全球80%以上的生物...顶多能剩下一些蟑螂啊水熊虫什么的...除非你在核掩体里,不过你一出来就会发现整个地球已经没有臭氧层了,光是太阳的紫外线就够杀死你的了...所以你只能在核掩体里饿死了...过几个月你就会觉得你还不如当天晚上和大家一起暴死了...”1yiednc

引起手机死机的各种原因

其实像智能手机死机的原因,网上早有分析。比如像下面这个分析,笔者认为就很靠谱的。1yiednc

在《智能手机死机的各种原因总结分析》一文中指出,手机和电脑一样,一般在两个阶段最易出现死机。一个是刚买的时候,另一个是对手机的系统已有一定了解,开始进行DIY和猛装软件的那几天。为什么这么说呢?因为刚买的时候,新手用户对智能手机不太了解,通常会出现许多失误操作,自然会出现死机和重启;然后在熟悉操作系统之后,用户了解到智能手机的功能是依靠海量的软件实现的,于是就开始猛装软件和游戏,同时又不注意管理,死机就无法避免了。1yiednc

一般经常死机都是发生在智能手机,如果智能手机当做普通手机使用,不安装任何软件,那么它也就不容易死机。为了尽量减少死机、白屏或自动重启的发生,就当做是智能手机使用建议吧。1yiednc

1.初购智能手机后,在使用前应该去网络上的一些智能手机论坛看看。一般来说这些论坛都会有相关系统和相关机型的使用注意事项,了解这些知识可以让你少走很多弯路。1yiednc

2.使用智能手机不要同时打开几个程序,一般以3个以下为宜,大型程序只能一次运行一个。程序的退出尽量依靠菜单依次退出,不要直接用挂机键。那样的话,程序是仍然在后台运行的,如果你再打开一个较大的程序,是很容易死机的。1yiednc

3.不要安装来历不明的软件(安装软件游戏最好到大型网站去下载)。1yiednc

4.做好手机上的程序管理,不要胡乱删除自己认为没必要的文件,一些死机故障正是因为有些用户删了系统文件导致经常死机。1yiednc

5.智能手机跟电脑一样,系统使用久后就会导致混乱也会出现死机现象。1yiednc

6.注意储存卡的保护,存储卡损坏跟存储卡内的数据有误均会出现循环开机或无法开机的故障,遇到这样的故障只能格式化存储卡,再不行就只能换卡了,所以安装软件在存储卡最好要谨慎。1yiednc

另外,在《专家揭问题手机黑幕:频繁死机因软件出错》一文中也指出,手机软件出现错误主要会导致以下几种情况:手机死机、重启的现象非常严重,错误率达27%;与通讯直接相关的功能(如通话功能、信息功能等)错误,约占52%;数据功能错误所占比例约为19%。手机频繁出现死机、重启等问题多是由于其自身软件错误导致。1yiednc

另外,在气温很低的情况下,手机也会出现“被冻死”的情况。其原因时,目前手机采用的锂离子电池,在零摄氏度时,其容量会减少20%,当达到零下10摄氏度时,容量可能只有一半左右。1yiednc

温度影响了电池的化学反应的速度,过低的温度导致了锂电池的化学反应迟缓,因此放电的电流变小,直接导致电池的可用容量降低。1yiednc

因此很多时候我们误以为锂电池在冬天的放点速度加快了,实际上本质是锂电池本身的电池容量降低了。1yiednc

当电池温度过低时,会造成电池有电却无法释放出来。再有,室内与室外温差大,许多手机用户从室外一直打到室内,不注意温度环境的变化,使得水汽凝结到手机上,进入手机的主板中。因此,手机会发生突然关机或者死机的现象。1yiednc

另外,冬天锂电池自身温度低于8度会停止工作,保护防止锂电子沉淀。这也是突然关机的原因之一。1yiednc

小结

综上,即便宇宙射线可能会引起手机死机,那也只是小得不能再小的小概率事件了。而我们生活中碰到的手机死机现象,这可是时有发生的呢。所以说,把手机死机原因和宇宙射线二者划近似等号,这根本就不科学呢。1yiednc

您对手机死机的原因又有怎样的看法,欢迎在评论栏中告诉我们!1yiednc

201606300001231yiednc

本文为EDN电子技术设计 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
您可能感兴趣的文章
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了