原文地址http://blog.csdn.net/zhshulin/article/details/50583724
java中将内存的控制交给JVM来实现,方便了JAVA程序猿,当然牺牲了一部分效率,不过总体来看是值得的。那么JVM中是如何设计GC的呢,本文从几个问题入手,然后分析了一下设计思路,如果有理解错误的地方,请批评指正!主要参考了《深入理解JAVA虚拟机》这本书,图是盗来的,图的内容和书上一样。
在JVM的内存模型中,堆内存是JAVA内存区域中最大的一部分,GC主要就是发生在堆中,用来回收那些无用的对象。这样直接就引申出了第一个问题:什么样的对象需要被回收?判断条件是什么?如何判断?
先谈谈什么对象需要被回收,OK,我们自己想一想,肯定是没用的对象需要被回收,对吧?那么如何判断哪些对象还有用,哪些没用了呢?一个对象被创建,如果被引用了,那这个对象肯定是有用的对吧,如果引用全失效了,那就是没用的对象了,需要被回收。基于这个思想,引用计数法诞生了。引用计数算法:这个非常容易理解,给每个对象添加一个引用计数器,对象每被引用一次,引用计数器就+1,引用失效时就-1。那么判断一个对象是否有用的条件就变成了对这个计数器值得判断了,如果为0,那么被回收,如果为>0,那么保留。但是这种方式会产生一个问题,就是对象之间的循环引用无法被识别,即使这两个对象不能被访问,但是它们之间互相引用着对方,故而计数器肯定>0,那么就不能被回收。JVM中并没有使用引用计数算法,而是使用了根搜索算法。根搜索算法:这个算法也不难理解,通过条件,选择一系列的对象成为“GC Roots"对象,然后将”GC Roots"对象作为起始点开始向下搜索,搜索所有走过的路径成为“引用链”。在这个引用链上的对象就保留,而如果一个或多个互相引用的对象不在这个引用链上,或者说对象到“GC Roots"不可达,那么这些就是无用的对象,都需要被回收。注:Java语言中,可作为GC Roots的对象包括下面几种:
1) 虚拟机栈(栈帧中的本地变量表)中引用的对象
2) 方法区中类静态属性引用的对象
3) 方法区中常量引用的对象
4) 本地方法栈中JNI(即一般说的Native方法)引用的对象
既然根搜索算法需要考虑到对象之间的引用,那么就要说一下JAVA中对象的引用类型了:从JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用,软引用,弱引用,虚引用,这四种引用的强度依次减弱
1) 强引用就是指在程序代码之中普遍存在的,类似 “Object obj = new Object()” 这类的引用,只要强引用还存在,垃圾回收器永远不会回收被引用的对象。我们也正是利用这个原理来重现了OOM异常。
2) 软引用(SoftReference类)是用来描述一些还有用但并非需要的对象,对于软引用关联着的对象,在系统将要发生内存异常之前,将会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存异常
3) 弱引用(WeakReference类)也是用来描述非必需对象的,被弱引用关联的对象只能生存到下一次GC发生之前,当垃圾收集器工作时,无论当前内存释放足够,都会回收掉只被弱引用关联的对象
4) 虚引用(PhantomReference类)也称为幽灵引用或者幻影引用,它是最弱的一种引用关系,一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例,对一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知
那么上述内容看完之后想必都知道了什么样的对象会被GC了吧,那么JVM又是通过什么方式来回收这些内存的呢?下面就需要了解一下垃圾的回收算法了。
标记-清除算法 试着想一想,如果要你要设计一个算法清除满足收集条件的对象来释放内存的时候你该怎么做呢?最简单的是不是就是把需要回收的对象标记一下,然后直接全部回收就行了?照着这个思路就是”标记-清除算法”的思想了,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。想法很简单,实际也就是这么做的。但是呢,这种方式是不是最好的?有什么缺陷? 想到这里,就需要分析一下了。一个个的标记然后清除,效率高吗?当然不。看看下图的标记-清除算法的示意图,可以发现,标记-清除之后会产生大量的内存碎片,如果碎片太多,当程序运行没有足够连续的内存空间来存放大对象的时候,就会不得不提前触发一次GC。概括来说就是有两个缺点:效率不高;内存碎片可能导致提前发生GC。 学习算法的童鞋应该都很清楚,效率是很重要的,有时候需要使用空间来换时间提高效率,那么就需要了解一下第二种回收算法了——复制算法。新闻热点
疑难解答