- 标★号为重要知识点
CMD采用的是标记-清除算法。会导致内存碎片。
可打开-XX:+UseCMSCompactAtFullCollection开关参数(默认打开)在进行Full GC之前整理内存碎片(称为“压缩”);
使用-XX:CMSFullGCsBeforeCompaction参数(默认0)设置多少次不带压缩的Full CG之后才进行一次带压缩的Full GC。
内存整理无法并行,还需要STW,需要适当调整内存整理的频率,在GC性能与空间利用率之间平衡。
老年代满、永久代满、CMS回收失败、从新生代要放入老年代的对象超过剩余空间。
-
内存区域只是一个划分规范,并不是所有虚拟机都是按照这样做的
-
最新的java8内存模型为:程序计数器、本地方法栈、java虚拟机栈、堆。以及放置在本地内存的元数据区。元数据区即java7的永久代。
-
堆:Java中的堆是用来存储对象本身的以及数组(当然,数组引用是存放在Java栈中的),是Java垃圾收集器管理的主要区域。堆是被所有线程共享的,在JVM中只有一个堆。
-
虚拟机栈:虚拟机栈中存放的是一个个的栈帧,每个栈帧对应一个被调用的方法,在栈帧中包括局部变量表、操作数栈、指向当前方法所属的类的运行时常量池的引用、方法返回地址和一些额外的附加信息。当线程执行一个方法时,就会随之创建一个对应的栈帧,并将建立的栈帧压栈。当方法执行完毕之后,便会将栈帧出栈。
-
本地方法栈:本地方法栈则是为执行本地方法(Native Method)服务的,在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一
-
方法区:方法区与堆一样,是被线程共享的区域。方法区存储了类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量以及编译器编译后的代码等。在方法区中有一个非常重要的部分就是运行时常量池,它是每一个类或接口的常量池的运行时表示形式,在类和接口被加载到JVM后,对应的运行时常量池就被创建出来。当然并非Class文件常量池中的内容才能进入运行时常量池,在运行期间也可将新的常量放入运行时常量池中,比如String的intern方法。当方法区无法满足内存分配需求时,则抛出OutOfMemoryError异常。在HotSpot虚拟机中,用永久代来实现方法区,将GC分代收集扩展至方法区,但是这样容易遇到内存溢出的问题。JDK1.7中,已经把放在永久代的字符串常量池移到堆中。JDK1.8撤销永久代,引入元空间。
-
程序计数器(线程私有):是当前线程所执行的字节码的行号指示器,每条线程都要有一个独立的程序计数器,这类内存也称为“线程私有”的内存。正在执行java方法的话,计数器记录的是虚拟机字节码指令的地址(当前指令的地址)。如果还是Native方法,则为空。
-
直接内存:在JDK1.4中新加入的NOI类,引入了一种基于通道与缓冲区的I/O方式,它可以使用Native函数直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。
- 程序计数器:不会出现内存溢出
- 线程栈:每个线程栈需要一定的内存空间,虚拟机内存极小的情况下可能出现内存溢出。大部分情况出现stackOverFlow的异常。
- 本地方法栈:一样有可能出现内存溢出。
- 方法区:类信息或者静态变量过多的话会导致溢出。
- 常量池:字符串过多的情况下溢出。
- 直接内存区:
- 静态集合中我们已经不需要但没有删除的数据。
- 未关闭的IO流。
- 内部类持有外部类,由于内部类隐式持有外部类的引用,但此时已经不再需要外部类时,外部类并未被回收。
- 改变哈希值,如果在哈希集合中已存好一个对象,之后修改对象的属性导致哈希值发生改变后,就定位不到该对象了,造成内存泄露。(比如student一开始hashcode为1,修改属性之后hashcode为2,但是hash表中位置没有变,到时候remove student的时候是按hashcode为2去删除,发现删除不掉hashcode为1的位置)
- 对象的生命周期超过它的使用周期。
过多使用了static变量;大量的递归或者死循环;大数据项的查询,如返回表的所有记录,应该采用分页查询。 栈过大会导致内存占用过多,频繁页交换阻碍效率。
- A,HashMap,vector等容易(静态集合类), 和应用程序生命周期一样,所引用的所有对象Object也不能释放。
- B,当集合类里面的对象属性被修改后,再调用remove()不起作用,hashcode值发生了改变
- C,其对象add监听器,但是往往释放对象时忘记去删除这些监听器
- D,各种连接记得关闭
- E,内部类的引用
- F,调用其他模块,对象作用参数
- G,单例模式,持有外部对象引用无法收回。
内存泄露例子
Vector<String> A = new Vector<String>();
for(int i = 0; i < 100; i++){
Object o = new Object ();
A.add(o);
o = null;
}
内存溢出的例子
StringBuffer b = new StringBuffer ();
for(int i =0; i < 100; i++){
for(int j =0; i < 100; j++){
b.append(*);
}
}
原因可能是:
- A,数据加载过多,如1次从数据库中取出过多数据
- B,集合类中有对对象的引用,用完后没有清空或者集合对象未置空导致引用存在等,使得JVM无法回收
- C,死循环,过多重复对象
- D,第三方软件的bug
- E,启动参数内存值设定的过小。
例如方法:修改JVM启动参数,加内存(-Xms,-Xmx);错误日志,是否还有其他错误;代码走查
- 内存泄漏定义(memory leak):一个不再被程序使用的对象或变量还在内存中占有存储空间。一次内存泄漏似乎不会有大的影响,但内存泄漏堆积后的后果就是内存溢出。
- 内存溢出(out of memory):指程序申请内存时,没有足够的内存供申请者使用,或者说,给了你一块存储int类型数据的存储空间,但是你却存储long类型的数据,那么结果就是内存不够用,此时就会报错OOM,即所谓的内存溢出。
- 静态集合类:
如HashMap、LinkedList等等。如果这些容器为静态变量,那么它们的生命周期与程序一致,则容器中的对象在程序结束之前将不能被释放,从而造成内存泄漏。简单而言,长生命周期的对象持有短生命周期对象的引用,尽管短生命周期的对象不再使用,但是因为长生命周期对象持有它的引用而导致不能被回收。
- 各种连接:
如数据库连接、网络连接和IO连接等。在对数据库进行操作的过程中,首先需要建立与数据库的连接,当不再使用时,需要调用close方法来释放与数据库的连接。只有连接被关闭后,垃圾回收器才会回收对应的对象。否则,如果在访问数据库的过程中,对Connection、Statement或ResultSet不显性地关闭,将会造成大量的对象无法被回收,从而引起内存泄漏。
- 变量不合理的作用域:
一个变量的定义的作用范围大于其使用范围,很有可能会造成内存泄漏。另一方面,如果没有及时地把对象设置为null,很有可能导致内存泄漏的发生。
- 内部类持有外部类:
如果一个外部类的实例对象的方法返回了一个内部类的实例对象,这个内部类对象被长期引用了,即使那个外部类实例对象不再被使用,但由于内部类持有外部类的实例对象,这个外部类对象将不会被垃圾回收,这也会造成内存泄露。
- 改变哈希值:
当一个对象被存储进HashSet集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段了,否则,对象修改后的哈希值与最初存储进HashSet集合中时的哈希值就不同了,在这种情况下,即使在contains方法使用该对象的当前引用作为的参数去HashSet集合中检索对象,也将返回找不到对象的结果,这也会导致无法从HashSet集合中单独删除当前对象,造成内存泄露。
- 单例模式:
不正确使用单例模式是引起内存泄漏的一个常见问题,单例对象在初始化后将在JVM的整个生命周期中存在(以静态变量的方式),如果单例对象持有外部的引用,那么这个对象将不能被JVM正常回收,导致内存泄漏。
未对作废数据内存单元置为null,尽早释放无用对象的引用,使用临时变量时,让引用变量在推出活动域后自动设置为null,暗示垃圾收集器收集;程序避免用String拼接,用StringBuffer,因为每个String会占用内存一块区域;尽量少用静态变量(全局不会回收);不要集中创建对象尤其大对象,可以使用流操作;尽量使用对象池,不再循环中创建对象,优化配置;创建对象到单例getInstance中,对象无法回收被单例引用;服务器session时间设置过长也会引起内存泄漏。
- 内存溢出(数组中不断添加对象)
- 内存泄漏 ( 静态变量引用对象、长字符串Intern、未关闭流)
- 栈溢出 ( 无线递归)
对象头(哈希值、gc年龄、一些锁相关数据)、对象实例数据、对齐填充。
- 类加载每次都递归交给父类去加载,是在加载不到才会交给下层加载
- Application ClassLoader --> Extension ClassLoader --> Bootstrap ClassLoader
-XX:PretenureSizeThreshold 参数可以设置超过这个值直接进入老年代。
或者年轻代放不下时就直接进入老年代了。
从GC roots分析可达性解决循环引用的问题。
虚拟机栈中的对象、本地方法栈中的对象、以及方法区中静态属性引用对象、常量引用对象。
finalize 方法重写,持有自身对象,即可逃逸一次(因finalize方法只执行一次)
- -XX:+DoEscapeAnalysis : 表示开启逃逸分析
- 逃逸分析指的是,在方法中创建的对象被传递出去后,就产生方法逃逸。
- 而非方法逃逸的变量,有可能在编译器的优化下直接分配到栈上。
通过类的全限定名查找到该类的字节码文件,将该字节码文件装载到jvm中,jvm将文件中静态字节码结构转换成
运行时动态数据结构,并在方法区生成一个定义该类的Class对象,作为方法区中该类的各种数据访问的入口。
确保该类的字节码文件中所包含的信息是否符合当前虚拟机的要求,不包含有危害虚拟机的信息(主要有四种验证,
文件格式验证,元数据验证排(语义)、字节码验证(防止危害虚拟机),符号引用验证)
为类变量分配内存,并设置一个初始值。被final修饰的类变量,该类型会在编译期就已经被分配并确定
将常量池中符号间接引用替换成直接引用
为类变量、静态代码块进行真正初始化(赋值操作)(类的初始化顺序,如果有父类先初始化父类中类变量
和静态代码块,在初始化子类的静态变量、静态代码块’)
当遇到new指令的时候,检查这个类是否被加载,没被加载的话加载,然后为对象分配内存空间并进行默认初始化,执行方法。
这两个区都是属于新生代。eden区用于存放那些刚被new出来的对象(因为大部分对象都是朝生夕死的,所以eden区的对象生命周期都比较短暂)。
survivor区分为两个,一个是s1,一个是s2。存在对象的区标记为from,另外一个空的区标记为to。对象会在这两区中倒腾,所以s1这轮是from,下一次就是to。
当eden区满的时候,开始清理eden区和from区,将剩下存活的对象移入to区当中去。
主要作用就是解释运行java字节码程序消除平台相关性。
- 可达性分析:通过一些被称为引用链(GC Roots)的对象作为起点,从这些节点开始向下搜索,搜索走过的路径被称为(Reference Chain),当一个对象到GC Roots没有任何引用链相连时(即从GC Roots节点到该节点不可达),则证明该对象是不可用的。
- 引用计数分析:对象每被引用一次就+1,这个规则比较简单,但是会出现两个对象互相引用。但是不可达的情况,却没有被回收。
- JMM(Java Memory Model) 是线程间通信的机制 。线程间共享变量存储在主内存,每个线程都有自己的本地内存,存储的是共享变量在本地的副本。
- 对应于cpu中的寄存器(主内存)与高速缓存(本地内存),可以这么理解。
-
内核线程(Kernel-Level Thread, KLT) 就是由操作系统内核支持的线程,内核通过操纵调度器(Scheduler)对线程进行调度。程序一般不会直接使用内核线程,而是去使用内核线程的一种高级接口-轻量级进程(Light Weight Process, LWP),轻量级进程就是我们通常意义上所讲的线程。这种轻量级进程与内核线程之间1:1的关系称为一对一的线程模型
-
用户线程(User Thread, UT)指的是完全建立在用户空间的线程库上,系统内核不能感知线程存在的实现。用户线程的建立、同步、销毁和调度完全在用户态中完成,不需要内核的帮助。因此操作比内核线程更快速,并可以支持更大的线程数量。这种进程(不是轻量级进程)与用户线程之间1:N的关系称为一对多的线程模型。
-
在早期的JVM实现当中使用的是用户线程1:N的一对多线程模型,在当时cpu的核数普遍较少。随着cpu的性能演进,核数越来越多了,如果继续采用用户线程模型的话,就很难利用cpu的多核优势。
-
如果某几个JVM线程被映射到一个内核线程后,(1:N或者M:N内存模型),如果这里面的一个JVM线程发起系统调用导致内核线程阻塞,那么剩下的几个线程依旧会被阻塞。
-
所以现今的JVM实现采用的是1:1的内核线程模型。
首先JVM内存限制于实际的最大物理内存了 假设物理内存无限大的话 JVM内存的最大值跟操作系统有很大的关系。简单的说就32位处理器虽然可控内存空间有4GB,但是具体的操作系统会给一个限制,这个限制一般是2GB-3GB(一般来说Windows系统下为1.5G-2G Linux系统 下为2G-3G) 而64bit以上的处理器就不会有限制了。
但是,这里会有一个问题在默认情况下,堆大小在32G以下的话JVM中的引用会占用4个字节。这是JVM在启动的时候就已经决定了的。如果你去掉了-XX:-UseCompressedOops选项的话,当然也可以在较小的堆上使用8字节的引用(但在生产系统中这么做是毫无意义的!)。一旦堆超过了32G,你就进入到64位的世界里了,因此对象引用就只能是8字节而非4字节了。此时,Java程序的堆中平均会有20%的空间是被对象引用占据了。相当于非常浪费,而且垃圾回收时间也会很长。所以每个JVM实例分配的内存最好控制在32G以内。
因为JVM针对不同的操作系统进行了的编译,编译的结果统一了对字节码文件的执行。
通俗的解释就是:有一个中国人(windows平台),还有一个日本人(linux平台),如果要与他们交流的话,我(开发者)必须
会说中国话,还得会说日本话。这时候一个英国人(JVM虚拟机)同时会中国话和日本话,而这时我让这个英国人当翻译,
我只需要会英语就行了,英国人会自动将英文翻译成中文和日文。(JVM虚拟机会自动将字节码翻译成平台能理解的操作指令)。
- BootstrapLoader:
BootstrapLoard是用C++语言写的,它是在Java虚拟机启动后初始化的,它主要负责加载%JAVA_HOME%/jre/lib,-Xbootclasspath参数指定的路径以及%JAVA_HOME%/jre/classes中的类。rt.jar
- ExtClassLoader:
Bootstraploader加载ExtClassLoader,并且将ExtClassLoader的父加载器设置为Bootstrploader,ExtClassLoader是用Java写的,具体来说就是 sun.misc.Launcher$ExtClassLoader,ExtClassLoader主要加载%JAVA_HOME%/jre/lib/ext,此路径下的所有classes目录以及java.ext.dirs系统变量指定的路径中类库。
- AppClassLoader:
Bootstrploader加载完ExtClassLoader后,就会加载AppClassLoader,并且将AppClassLoader的父加载器指定为ExtClassLoader。 AppClassLoader也是用Java写成的,它的实现类是sun.misc.Launcher$AppClassLoader,另外我们知道ClassLoader中有个getSystemClassLoader方法,此方法返回的正是AppclassLoader.AppClassLoader主要负责加载classpath所指定的位置的类或者是jar文档,它也是Java程序默认的类加载器。
双亲委派机制的工作流程:
-
当前ClassLoader首先从自己已经加载的类中查询是否此类已经加载,如果已经加载则直接返回原来已经加载的类。每个类加载器都有自己的加载缓存,当一个类被加载了以后就会放入缓存,等下次加载的时候就可以直接返回了。
-
当前classLoader的缓存中没有找到被加载的类的时候,委托父类加载器去加载,父类加载器采用同样的策略,首先查看自己的缓存,然后委托父类的父类去加载,一直到bootstrp ClassLoader.
-
当所有的父类加载器都没有加载的时候,再由当前的类加载器加载,并将其放入它自己的缓存中,以便下次有加载请求的时候直接返回。
频繁的原因:
- 新生代的内存空间分配过小。
- 程序中new太多声明周期短的对象。
- threshold值太高,新生代中的对象迟迟不进入老年代,使得一直占用新生代空间。
很慢的原因:
- 新生代内存空间太大,扫描时间过长。
- 对象引用链较长,进行可达性分析时间较长。
- 新生代survivor区设置的比较小,清理后剩余的对象不能装进去需要移动到老年代,造成移动开销。
- 内存分配担保失败,由minor gc转化为full gc。
- 采用的垃圾收集器效率较低,比如新生代使用serial收集器。
- GC:GC前后进行dump, dump出来后分析到底是哪些大对象造成full GC。
- 内存溢出: 在内存溢出的时候进行Dump
- Serial (Client,复制,串行)
- parNew(serial的并行版本,可和CMS配合)
- parallel Scavenge(并行回收,致力于吞吐量,不适合交互频繁的服务器)
- serial old(跟serial差不多,区别是使用标记整理,适合Client)
- parallel old(和parallel Scavenge差不多,区别是标记整理,不适合交互频繁的服务器)
- cms(低停顿,并发收集,标记两次,适合Server)
G1(将内存分为一个一个region,性能良好,低停顿,双清理算法,适合Server)
GC算法分成四种:
-
标记清除算法:首先先标记,然后统一把标记的对象依次清除,缺点是CPU消耗大,极易出现内存碎片,所以一般用于老年代。
-
复制算法:把内存区域分成俩块,每次只使用其中一块,然后把还存活的对象放在另一块中,清空原先的块,这样的话不会出现内存碎片。新生代常用的。
-
复制整理:指针碰撞,将使用过的对象移动到内存的一段,不用的放在另一端。
-
分代收集:根据不同代的区别,使用符合不同代的算法。
-
简单来说minorGC发生在新生代,gc频繁而且需要开销小,如果采用整理算法的话,频繁整理效率低,所以采取复制算法。
-
老年代:对象相较于新生代gc不频繁且对象少,采取标记清除或者标记整理算法。
1.复制算法 复制算法将可用内存按容量划分为相等的两部分,然后每次只使用其中的一块,当一块内存用完时,就将还存活的对象复制到第二块内存上,然后一次性清楚完第一块内存,再将第二块上的对象复制到第一块。但是这种方式,内存的代价太高,每次基本上都要浪费一半的内存。 2.标记清除算法 是JVM垃圾回收算法中最古老的一个,该算法共分成两个阶段,第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,清除未被标记的对象。该算法的缺点是需要暂停整个应用,并且在回收以后未使用的空间是不连续,即内存碎片,会影响到存储。 3.标记整理算法 此算法结合了标记-清楚算法和复制算法的优点,也分为两个阶段,第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,在回收不存活的对象占用的空间后,会将所有的存活对象往左端空闲空间移动,并更新对应的指针。标记-整理算法是在标记-清除算法的基础上,又进行了对象的移动,因此成本更高,但是却解决了内存碎片的问题,按顺序排放,同时解决了复制算法所需内存空间过大的问题。 4.分代收集 分代收集算法是目前大部分JVM的垃圾收集器采用的算法。它的核心思想是根据对象存活的生命周期将内存划分为若干个不同的区域。一般情况下将堆区划分为老年代(Tenured Generation)和新生代(Young Generation),在堆区之外还有一个代就是永久代(Permanet Generation)。老年代的特点是每次垃圾收集时只有少量对象需要被回收,而新生代的特点是每次垃圾回收时都有大量的对象需要被回收,那么就可以根据不同代的特点采取最适合的收集算法。
- GC即垃圾回收,回收的是不再使用的对象的内存空间。
- 在java语言当中封装了内存分配的操作,程序员不需要关心开辟内存空间和释放内存空间。(C++语言就需要)就可以把更多精力放在与内存无关的编码上。
- 所以java语言需要设计一套方法用于回收程序中不再使用的对象的内存空间,即GC。
- 通过可达性分析,回收确定不可达的对象的内存空间。
- 不能,调用System.gc()并不一点执行。
- System.gc()可以通知虚拟机进行垃圾回收,但不保证执行。
-
检查异常是在程序中最经常碰到异常,所有继承自Exception并且不是运行时异常的异常都是检查异常,比如咱们最常见的IO异常和SQL异常。这种异常都发生在编译的阶段,Java编译器强制程序去捕获此类型的异常,即它会把可能会出现这些异常的代码放到try块中,把对异常的处理代码放到catch块中。受检异常跟程序运行的上下文环境有关,即使程序设计无误,仍然可能因使用的问题而引发。
-
运行时异常不同于检查异常,编译器没有强制对其进行捕获并处理,如果不对异常进行处理,那么当出现这种异常的时候,会由JVM来处理,比如NullPointerException异常,它就是运行时异常。只要程序设计得没有问题通常就不会发生运行时异常。
以下是一些关于异常的优良实践(出自Effective Java)
- 不要将异常处理用于正常的控制流(设计良好的API不应该强迫它的调用者为了正常的控制流而使用异常)
- 对可以恢复的情况使用受检异常,对编程错误使用运行时异常
- 避免不必要的使用受检异常(可以通过一些状态检测手段来避免异常的发生)
- 优先使用标准的异常
- 每个方法抛出的异常都要有文档
- 保持异常的原子性
- 不要在catch中忽略掉捕获到的异常
通常我们定义一个基本数据类型的变量,一个对象的引用,还有就是函数调用的现场保存都使用内存中的栈空间;而通过new关键字和构造器创建的对象放在堆空间;程序中的字面量(literal)如直接书写的100、"hello"和常量都是放在静态区中。栈空间操作起来最快但是栈很小,通常大量的对象都是放在堆空间,理论上整个内存没
有被其他进程使用的空间甚至硬盘上的虚拟内存都可以被当成堆空间来使用。
java堆,分新生代老年代,新生代有Eden,from surviver,to surviver三个空间,堆被所有线程共。eden内存不足时,发生一次minor GC,会把from survivor和eden的对象复制到to survivor,这次的to survivor就变成了下次的from survivor,经过多次minor GC,默认15次,达到次数的对象会从survivor进行老年代。1次new如果新生代装不下,则直接进入老年代。还有动态年龄判定。 年龄从小到大的累加和超过survivor一半的话,大于或者等于这个最大年龄的直接进入老年代。
堆的年轻代大则老年代小,GC少,但是每次时间会比较长。年轻代小则老年代大,会缩短每次GC的时间,但是次数频繁。可以让老年代尽量缓存常用对象,JVM默认年轻代和老年代的大小比例为1:2,。观察峰值老年代内存,不影响full GC,加大老年代可调1:1,但是要给老年代预留三分之一的空间。减少使用全局变量和大对象 ,调整新生代,老年代到最合适。
YGC :对新生代堆进行gc。频率比较高,因为大部分对象的存活寿命较短,在新生代里被回收。性能耗费较小。 FGC :全堆范围的gc。默认堆空间使用到达80%(可调整)的时候会触发fgc。以我们生产环境为例,一般比较少会触发fgc,有时10天或一周左右会有一次。
YGC发生场景:edn空间不足 FGC发生场景:old空间不足,perm空间不足,调用方法System.gc() ,ygc时的悲观策略, dump live的内存信息时(jmap –dump:live)
- 方法区是虚拟机规范,而永久代是HotSpot的实现,其他虚拟机可能没有永久代这个概念。
- 在java8中将永久代从虚拟机堆内存移到了本地内存。称之为元空间。
- 不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。(字符串常量移至java堆中)因此,默认情况下,元空间的大小仅受本地内存限制,但可以通过参数来指定元空间的大小。
- 为什么要将永久代替换成Metaspace?可能的原因有:
- 字符串存在永久代中,容易出现性能问题和内存溢出。
- 类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出。
- 永久代会为 GC 带来不必要的复杂度,并且回收效率偏低。
- Oracle 可能会将HotSpot 与 JRockit 合二为一。
复制算法(新生代算法):
-
复制算法是针对Java堆中的新生代内存垃圾回收所使用的回收策略,解决了”标记-清理”的效率问题。
-
复制算法将堆中可用的新生代内存按容量划分成大小相等的两块内存区域,每次只使用其中的一块区域。当其中一块内存区域需要进行垃圾回收时,会将此区域内还存活着的对象复制到另一块上面,然后再把此内存区域一次性清理掉。这样做的好处是每次都是对整个新生代一半的内存区域进行内存回收,内存分配时也就不需要考虑内存碎片等复杂情况,只需要移动堆顶指针,按顺序分配即可。此算法实现简单,运行高效。
新生代的对象大多数gc完没剩多少,没必要使用整理算法
标记整理算法(老年代回收算法):
-
复制算法在对象存活率较高的老年代会进行很多次的复制操作,效率很低,所以在栈的老年代不适用复制算法。
-
针对老年代对象存活率高的特点,提出了一种称之为”标记-整理算法”。标记过程仍与”标记-清除”过程一致,但后续步骤不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉端边界以外的内存。
-
有一个参数控制对象的年龄多少进入老年代,还有一个参数是控制对象多大直接进入老年代
老年代的对象大多回收比较少,如果采用复制算法的话,复制效率低。
- 语言无关的经典优化技术之一:公共子表达式消除。
- 语言相关的经典优化技术之一:数组范围检查消除。
- 最重要的优化技术之一:方法内联。
- 最前沿的优化技术之一:逃逸分析。(栈上分配,标量替换,消除同步)
-
大多数现代微处理器都会采用将指令乱序执行(out-of-order execution,简称OoOE或OOE)的方法,在条件允许的情况下,直接运行当前有能力立即执行的后续指令,避开获取下一条指令所需数据时造成的等待。
-
通过乱序执行的技术,处理器可以大大提高执行效率。除了处理器,常见的Java运行时环境的JIT编译器也会做指令重排序操作,即生成的机器指令与字节码指令顺序不一致。
-
内存屏障(Memory Barrier,或有时叫做内存栅栏,Memory Fence)是一种CPU指令,用于控制特定条件下的重排序和内存可见性问题。Java编译器也会根据内存屏障的规则禁止重排序。java编译器在生成指令序列的适当位置会插入内存屏障指令来禁止特定类型的处理器重排序。
-
StoreLoad Barriers是一个“全能型”的屏障,它同时具有其他三个屏障的效果。现代的多处理器大都支持该屏障(其他类型的屏障不一定被所有处理器支持)。执行该屏障开销会很昂贵,因为当前处理器通常要把写缓冲区中的数据全部刷新到内存中(buffer fully flush)。
https://cloud.tencent.com/developer/article/1198524 一、堆设置
-Xms:初始堆大小
-Xmx:最大堆大小
-XX:NewSize=n:设置年轻代大小
-XX:NewRatio=n:设置年轻代和年老代的比值。如:为3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代和的1/4
-XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如:3,表示Eden:Survivor=3:2,
一个Survivor区占整个年轻代的1/5
-XX:MaxPermSize=n:设置持久代大小
二、收集器设置
-XX:+UseSerialGC:设置串行收集器
-XX:+UseParallelGC:设置并行收集器
-XX:+UseParalledlOldGC:设置并行年老代收集器
-XX:+UseConcMarkSweepGC:设置并发收集器
三、垃圾回收统计信息
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-Xloggc:filename
四、并行收集器设置
-XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数。
-XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间
-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)
五、并发收集器设置
-XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况。
-XX:ParallelGCThreads=n:设置并发收集器年轻代收集方式为并行收集时,使用的CPU数。并行收集线程数。
-
初始标记:独占PUC,仅标记GCroots能直接关联的对象
-
并发标记:可以和用户线程并行执行,标记所有可达对象
-
重新标记:独占CPU(STW),对并发标记阶段用户线程运行产生的垃圾对象进行标记修正
-
并发清理:可以和用户线程并行执行,清理垃圾
并发,低停顿
-
对CPU非常敏感:在并发阶段虽然不会导致用户线程停顿,但是会因为占用了一部分线程使应用程序变慢
-
无法处理浮动垃圾:在最后一步并发清理过程中,用户线程执行也会产生垃圾,但是这部分垃圾是在标记之后,所以只有等到下一次gc的时候清理掉,这部分垃圾叫浮动垃圾
3, CMS使用“标记-清理”法会产生大量的空间碎片,当碎片过多,将会给大对象空间的分配带来很大的麻烦,往往会出现老年代还有很大的空间但无法找到足够大的连续空间来分配当前对象,不得不提前触发一次FullGC,为了解决这个问题CMS提供了一个开关参数,用于在CMS顶不住,要进行FullGC时开启内存碎片的合并整理过程,但是内存整理的过程是无法并发的,空间碎片没有了但是停顿时间变长了
-
年轻带晋升到老年带没有足够的连续空间,很有可能是内存碎片导致的
-
在并发过程中JVM觉得在并发过程结束之前堆就会满,需要提前触发FullGC
-
并行于并发:G1能充分利用CPU、多核环境下的硬件优势,使用多个CPU(CPU或者CPU核心)来缩短stop-The-World停顿时间。部分其他收集器原本需要停顿Java线程执行的GC动作,G1收集器仍然可以通过并发的方式让java程序继续执行。
-
分代收集:分代概念在G1中依然得以保留。虽然G1可以不需要其它收集器配合就能独立管理整个GC堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获取更好的收集效果。也就是说G1可以自己管理新生代和老年代了。
-
空间整合:由于G1使用了独立区域(Region)概念,G1从整体来看是基于“标记-整理”算法实现收集,从局部(两个Region)上来看是基于“复制”算法实现的,但无论如何,这两种算法都意味着G1运作期间不会产生内存空间碎片。
-
可预测的停顿:这是G1相对于CMS的另一大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用这明确指定一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。
- 与其它收集器相比,G1变化较大的是它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留了新生代和来年代的概念,但新生代和老年代不再是物理隔离的了它们都是一部分Region(不需要连续)的集合。同时,为了避免全堆扫描,G1使用了Remembered Set来管理相关的对象引用信息。当进行内存回收时,在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏了。
如果不计算维护Remembered Set的操作,G1收集器的运作大致可划分为以下几个步骤:
-
初始标记(Initial Making)
-
并发标记(Concurrent Marking)
-
最终标记(Final Marking)
-
筛选回收(Live Data Counting and Evacuation)
看上去跟CMS收集器的运作过程有几分相似,不过确实也这样。初始阶段仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS(Next Top Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可以用的Region中创建新对象,这个阶段需要停顿线程,但耗时很短。并发标记阶段是从GC Roots开始对堆中对象进行可达性分析,找出存活对象,这一阶段耗时较长但能与用户线程并发运行。而最终标记阶段需要吧Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程,但可并行执行。最后筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划,这一过程同样是需要停顿线程的,但Sun公司透露这个阶段其实也可以做到并发,但考虑到停顿线程将大幅度提高收集效率,所以选择停顿。
使用一个参数使得内存溢出的时候生成堆快照,然后用jvisualvm等内存分析工具进行分析
- 双亲委派模型的工作过程是:如果一个类加载器收到了类加载的请求,他首先不会自己去尝试加载这个类,而是把这个请求委派父类加载器去完成。每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个请求(他的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。 为什么要这么做呢?
- 如果没有使用双亲委派模型,由各个类加载器自行加载的话,如果用户自己编写了一个称为java.lang.Object的类,并放在程序的ClassPath中,那系统将会出现多个不同的Object类, Java类型体系中最基础的行为就无法保证。应用程序也将会变得一片混乱。
线程上下文类加载器可打破。tomcat为了实现类的多版本以及热部署,使用自定义的类加载器来打破双亲委托机制。
jstack命令
-server 服务器启动模式
-Xms512m 最小堆大小
-Xmx512m 最大堆大小
-Xss1024K 栈空间大小
-XX:PermSize=256m 永久代大小
-XX:MaxPermSize=512m 最大永久代大小
-XX:MaxTenuringThreshold=20 晋升年龄
-XX:CMSInitiatingOccupancyFraction=80 当内存达到的阈值进行gc
-XX:+UseCMSInitiatingOccupancyOnly。是否一直使用最开始的阈值,后期不动态调整。