内存管理与垃圾回收

本文主要是基于sunjdk1.6garbagecollector（作者：毕玄）的整理与总结，原文请读者在网上搜索。

1、java虚拟机运行时的数据区

2、常用的内存区域调节参数

-xms：初始堆大小，默认为物理内存的1/64(<1gb)；默认(minheapfreeratio参数可以调整)空余堆内存小于40%时，jvm就会增大堆直到-xmx的最大限制

-xmx：最大堆大小，默认(maxheapfreeratio参数可以调整)空余堆内存大于70%时，jvm会减少堆直到-xms的最小限制

-xmn：新生代的内存空间大小，注意：此处的大小是（eden+2survivorspace)。与jmap-heap中显示的newgen是不同的。整个堆大小=新生代大小+老生代大小+永久代大小。在保证堆大小不变的情况下，增大新生代后,将会减小老生代大小。此值对系统性能影响较大,sun官方推荐配置为整个堆的3/8。

-xx:survivorratio：新生代中eden区域与survivor区域的容量比值，默认值为8。两个survivor区与一个eden区的比值为2:8,一个survivor区占整个年轻代的1/10。

-xss：每个线程的堆栈大小。jdk5.0以后每个线程堆栈大小为1m,以前每个线程堆栈大小为256k。应根据应用的线程所需内存大小进行适当调整。在相同物理内存下,减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的，不能无限生成，经验值在3000~5000左右。一般小的应用，如果栈不是很深，应该是128k够用的，大的应用建议使用256k。这个选项对性能影响比较大，需要严格的测试。和threadstacksize选项解释很类似,官方文档似乎没有解释,在论坛中有这样一句话:"-xssistranslatedinavmflagnamedthreadstacksize”一般设置这个值就可以了。

-xx:permsize：设置永久代(permgen)初始值。默认值为物理内存的1/64。

-xx:maxpermsize：设置持久代最大值。物理内存的1/4。

3、内存分配方法

1）堆上分配2）栈上分配3）堆外分配（directbytebuffer或直接使用unsafe.allocatememory,但不推荐这种方式）

4、监控方法

1）系统程序运行时可通过jstat–gcutil来查看堆中各个内存区域的变化以及gc的工作状态；2）启动时可添加-xx:+printgcdetails–xloggc:输出到日志文件来查看gc的状况；3）jmap–heap可用于查看各个内存空间的大小；

5）断代法可用gc汇总

一、新生代可用gc

1）串行gc(serialcopying)：client模式下默认gc方式，也可通过-xx:+useserialgc来强制指定；默认情况下eden、s0、s1的大小通过-xx:survivorratio来控制，默认为8，含义为eden:s0的比例，启动后可通过jmap–heap[pid]来查看。

默认情况下，仅在tlab或eden上分配，只有两种情况下会在老生代分配：1、需要分配的内存大小超过edenspace大小；2、在配置了pretenuresizethreshold的情况下，对象大小大于此值。

默认情况下，触发minorgc时：之前minorgc晋级到old的平均大小<老生代的剩余空间

默认情况下，新生代对象晋升到老生代的规则：

1、经历多次minorgc仍存活的对象，可通过以下参数来控制：以maxtenuringthreshold值为准，默认为15。2、tospace放不下的，直接放入老生代；

2）并行gc（parnew）：cmsgc时默认采用，也可采用-xx:+useparnewgc强制指定；垃圾回收的时候采用多线程的方式。

3）并行回收gc(parallelscavenge)：server模式下默认的gc方式，也可采用-xx:+useparallelgc强制指定；eden、s0、s1的大小可通过-xx:survivorratio来控制，但默认情况下以-xx:initialsurivivorratio为准，此值默认为8，代表的为新生代大小:s0，这点要特别注意。

默认情况下，当tlab、eden上分配都失败时，判断需要分配的内存大小是否>=edenspace的一半大小，如是就直接在老生代上分配；

默认情况下的垃圾回收规则：

1、在回收前psgc会先检测之前每次psgc时，晋升到老生代的平均大小是否大于老生代的剩余空间，如大于则直接触发fullgc；2、在回收后，也会按照上面的规则进行检测。

默认情况下的新生代对象晋升到老生代的规则：1、经历多次minorgc仍存活的对象，可通过以下参数来控制：alwaystenure，默认false，表示只要minorgc时存活，就晋升到老生代；nevertenure，默认false，表示永不晋升到老生代；上面两个都没设置的情冴下，如useadaptivesizepolicy，启动时以initialtenuringthreshold值作为存活次数的阈值，在每次psgc后会动态调整，如不使用useadaptivesizepolicy，则以maxtenuringthreshold为准。2、tospace放不下的，直接放入老生代。

在回收后，如useadaptivesizepolicy，psgc会根据运行状态动态调整eden、to以及tenuringthreshold的大小。如果不希望动态调整可设置-xx:-useadaptivesizepolicy。如希望跟踪每次的变化情况，可在启劢参数上增加：printadaptivesizepolicy。

二、老生代可用gc

1、串行gc(serialcopying)：client方式下默认gc方式，可通过-xx:+useserialgc强制指定。

触发机制汇总：1）oldgen空间不足；2）permgen空间不足；3）minorgc时的悲观策略；4）minorgc后在eden上分配内存仍然失败；5）执行heapdump时；6）外部调用system.gc，可通过-xx:+disableexplicitgc来禁止。

2、并行回收gc(parallelscavenge)：server模式下默认gc方式，可通过-xx:+useparallelgc强制指定；并行的线程数为当cpucore<=8?cpucore:3+(cpucore*5)/8或通过-xx:parallelgcthreads=x来强制指定。如scavengebeforefullgc为true（默认值），则先执行minorgc。

3、并行compacting：可通过-xx:+useparalleloldgc强制指定。

4、并发cms：可通过-xx:+useconcmarksweepgc来强制指定。并发的线程数默认为:(并行gc线程数+3)/4，也可通过parallelcmsthreads指定。

触发机制：1、当老生代空间的使用到达一定比率时触发；

hotspotv1.6中默认为65%，可通过printcmsinitiationstatistics（此参数在v1.5中不能用）来查看这个值到底是多少；可通过cmsinitiatingoccupancyfraction来强制指定，默认值并不是赋值在了这个值上，是根据如下公式计算出来的：((100-minheapfreeratio)+(double)(cmstriggerratio*minheapfreeratio)/100.0)/100.0;其中,minheapfreeratio默认值：40cmstriggerratio默认值：80。

2、当permgen采用cms收集且空间使用到一定比率时触发；

permgen采用cms收集需设置：-xx:+cmsclassunloadingenabledhotspotv1.6中默认为65%；可通过cmsinitiatingpermoccupancyfraction来强制指定，同样，它是根据如下公式计算出来的：((100-minheapfreeratio)+(double)(cmstriggerpermratio*minheapfreeratio)/100.0)/100.0;其中，minheapfreeratio默认值：40cmstriggerpermratio默认值：80。

3、hotspot根据成本计算决定是否需要执行cmsgc；可通过-xx:+usecmsinitiatingoccupancyonly来去掉这个动态执行的策略。4、外部调用了system.gc，且设置了explicitgcinvokesconcurrent；需要注意，在hotspot6中，在这种情况下如应用同时使用了nio，可能会出现bug。

6、gc组合

1）默认gc组合

2）可选的gc组合

7、gc监测

1）jstat–gcutil[pid][intervel][count]2）-verbose:gc//可以辅助输出一些详细的gc信息；-xx:+printgcdetails//输出gc详细信息；-xx:+printgcapplicationstoppedtime//输出gc造成应用暂停的时间-xx:+printgcdatestamps//gc发生的时间信息；-xx:+printheapatgc//在gc前后输出堆中各个区域的大小；-xloggc:[file]//将gc信息输出到单独的文件中，建议都加上，这个消耗不大，而且对查问题和调优有很大的帮助。gc的日志拿下来后可使用gclogviewer或gchisto进行分析。3）图形化的情况下可直接用jvisualvm进行分析。

4）查看内存的消耗状况

（1）长期消耗，可以直接dump，然后mat(内存分析工具)查看即可

（2）短期消耗，图形界面情况下，可使用jvisualvm的memoryprofiler或jprofiler。

8、系统调优方法

步骤：1、评估现状2、设定目标3、尝试调优4、衡量调优5、细微调整

设定目标：

1）降低fullgc的执行频率？2）降低fullgc的消耗时间？3）降低fullgc所造成的应用停顿时间？4）降低minorgc执行频率？5）降低minorgc消耗时间？例如某系统的gc调优目标：降低fullgc执行频率的同时，尽可能降低minorgc的执行频率、消耗时间以及gc对应用造成的停顿时间。

衡量调优：

1、衡量工具1）打印gc日志信息：-xx:+printgcdetails–xx:+printgcapplicationstoppedtime-xloggc:{文件名}-xx:+printgctimestamps2）jmap：（由于每个版本jvm的默认值可能会有改变，建议还是用jmap首先观察下目前每个代的内存大小、gc方式）3）运行状况监测工具：jstat、jvisualvm、sar、gclogviewer

2、应收集的信息1）minorgc的执行频率；fullgc的执行频率，每次gc耗时多少？2）高峰期什么状况？3）minorgc回收的效果如何？survivor的消耗状况如何，每次有多少对象会进入老生代？4）fullgc回收的效果如何？（简单的memoryleak判断方法）5）系统的load、cpu消耗、qpsortps、响应时间

qps每秒查询率：是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。在因特网上，作为域名服务器的机器性能经常用每秒查询率来衡量。对应fetches/sec，即每秒的响应请求数，也即是最大吞吐能力。tps(transactionpersecond)：每秒钟系统能够处理的交易或事务的数量。

尝试调优：

注意javarmi的定时gc触发机制，可通过：-xx:+disableexplicitgc来禁止或通过-dsun.rmi.dgc.server.gcinterval=3600000来控制触发的时间。

1）降低fullgc执行频率–通常瓶颈老生代本身占用的内存空间就一直偏高，所以只要稍微放点对象到老生代，就fullgc了；通常原因：系统缓存的东西太多；例如：使用oracle10g驱动时preparedstatementcache太大；查找办法：现执行dump然后再进行mat分析；

（1）minorgc后总是有对象不断的进入老生代，导致老生代不断的满通常原因：survivor太小了系统表现：系统响应太慢、请求量太大、每次请求分配的内存太多、分配的对象太大...查找办法：分析两次minorgc之间到底哪些地方分配了内存；利用jstat观察survivor的消耗状况，-xx:printheapatgc，输出gc前后的详细信息；对于系统响应慢可以采用系统优化，不是gc优化的内容；

（2）老生代的内存占用一直偏高调优方法：①扩大老生代的大小（减少新生代的大小或调大heap的大小）；减少new注意对minorgc的影响并且同时有可能造成fullgc还是严重；调大heap注意fullgc的时间的延长，cpu够强悍嘛，os是32bit的吗？②程序优化（去掉一些不必要的缓存）

（3）minorgc后总是有对象不断的进入老生代前提：这些进入老生代的对象在fullgc时大部分都会被回收调优方法：①降低minorgc的执行频率；②让对象尽量在minorgc中就被回收掉：增大eden区、增大survivor、增大tenuringthreshold；注意这些可能会造成minorgc执行频繁；③切换成cmsgc：老生代还没有满就回收掉，从而降低fullgc触发的可能性；④程序优化：提升响应速度、降低每次请求分配的内存、

（4）降低单次fullgc的执行时间通常原因：老生代太大了...调优方法：1）是并行gc吗？2）升级cpu3）减小heap或老生代

（5）降低minorgc执行频率通常原因：每次请求分配的内存多、请求量大通常办法：1）扩大heap、扩大新生代、扩大eden。注意点：降低每次请求分配的内存；横向增加机器的数量分担请求的数量。

（6）降低minorgc执行时间通常原因：新生代太大了，响应速度太慢了，导致每次minorgc时存活的对象多通常办法：1）减小点新生代吧；2）增加cpu的数量、升级cpu的配置；加快系统的响应速度

细微调整：

首先需要了解以下情况：

①当响应速度下降到多少或请求量上涨到多少时，系统会宕掉？

②参数调整后系统多久会执行一次minorgc，多久会执行一次fullgc，高峰期会如何？

需要计算的量：

①每次请求平均需要分配多少内存？系统的平均响应时间是多少呢？请求量是多少、多常时间执行一次minorgc、fullgc？

②现有参数下，应该是多久一次minorgc、fullgc，对比真实状况，做一定的调整；

必杀技：提升响应速度、降低每次请求分配的内存？

9、系统调优举例

现象：1、系统响应速度大概为100ms；2、当系统qps增长到40时，机器每隔5秒就执行一次minorgc，每隔3分钟就执行一次fullgc，并且很快就一直fullgc了；4、每次fullgc后旧生代大概会消耗400m，有点多了。

解决方案：解决fullgc次数过多的问题

（1）降低响应时间或请求次数，这个需要重构，比较麻烦；——这个是终极方法，往往能够顺利的解决问题，因为大部分的问题均是由程序自身造成的。

（2）减少老生代内存的消耗，比较靠谱；——可以通过分析dump文件（jmapdump），并利用mat查找内存消耗的原因，从而发现程序中造成老生代内存消耗的原因。

（3）减少每次请求的内存的消耗，貌似比较靠谱；——这个是海市蜃楼，没有太好的办法。

（4）降低gc造成的应用暂停的时间——可以采用cmsgs垃圾回收器。参数设置如下：

-xms1536m-xmx1536m-xmn700m-xx:survivorratio=7-xx:+useconcmarksweepgc-xx:+usecmscompactatfullcollection

-xx:cmsmaxabortableprecleantime=1000-xx:+cmsclassunloadingenabled-xx:+usecmsinitiatingoccupancyonly-xx:+disableexplicitgc

（5）减少每次minorgc晋升到old的对象。可选方法：1）调大新生代。2）调大survivor。3）调大tenuringthreshold。

调大survivor：当前采用psgc，survivorspace会被动态调整。由于调整幅度很小，导致了经常有对象直接转移到了老生代；于是禁止survivor区的动态调整了，-xx:-useadaptivesizepolicy，并计算survivorspace需要的大小，于是继续观察，并做微调…。最终将fullgc推迟到2小时1次。

10、垃圾回收的实现原理

内存回收的实现方法：1）引用计数：不适合复杂对象的引用关系，尤其是循环依赖的场景。2）有向图tracing：适合于复杂对象的引用关系场景，hotspot采用这种。常用算法：copying、mark-sweep、mark-compact。

hotspot从rootset开始扫描有引用的对象并对reference类型的对象进行特殊处理。以下是rootset的列表：1）当前正在执行的线程；2）全局/静态变量；3）jvmhandles；4）jni【javanativeinterface】handles；

另外：minorgc只扫描新生代，当老生代的对象引用了新生代的对象时，会采用如下的处理方式：在给对象赋引用时，会经过一个writebarrier的过程，以便检查是否有老生代引用新生代对象的情况，如有则记录到rememberset中。并在minorgc时，rememberset指向的新生代对象也作为rootset。

新生代串行gc(serialcopying)：

新生代串行gc(serialcopying)完整内存的分配策略：

1）首先在tlab（本地线程分配缓冲区）上尝试分配；2）检查是否需要在新生代上分配，如需要分配的大小小于pretenuresizethreshold，则在eden区上进行分配，分配成功则返回；分配失败则继续；3）检查是否需要尝试在老生代上分配，如需要，则遍历所有代并检查是否可在该代上分配，如可以则进行分配；如不需要在老生代上尝试分配，则继续；4）根据策略决定执行新生代gc或fullgc，执行fullgc时不清除softref；5）如需要分配的大小大于pretenuresizethreshold，尝试在老生代上分配，否则尝试在新生代上分配；6）尝试扩大堆并分配；7）执行fullgc，并清除所有softref，按步骤5继续尝试分配。

新生代串行gc(serialcopying)完整内存回收策略1）检查to是否为空，不为空返回false；2）检查老生代剩余空间是否大于当前eden+from已用的大小，如大于则返回true，如小于且handlepromotionfailure为true，则检查剩余空间是否大于之前每次minorgc晋级到老生代的平均大小，如大于返回true，如小于返回false。3）如上面的结果为false，则执行fullgc；如上面的结果为true，执行下面的步骤；4）扫描引用关系，将活的对象copy到tospace，如对象在minorgc中的存活次数超过tenuring_threshold或分配失败，则往老生代复制，如仍然复制失败，则取决于handlepromotionfailure，如不需要处理，直接抛出oom，并退出vm，如需处理，则保持这些新生代对象不动；

新生代可用gc-ps

完整内存分配策略1）先在tlab上分配，分配失败则直接在eden上分配；2）当eden上分配失败时，检查需要分配的大小是否>=edenspace的一半，如是，则直接在老生代分配；3）如分配仍然失败，且gc已超过频率，则抛出oom；4）进入基本分配策略失败的模式；5）执行psgc，在eden上分配；6）执行非最大压缩的fullgc，在eden上分配；7）在旧生代上分配；8）执行最大压缩fullgc，在eden上分配；9）在旧生代上分配；10）如还失败，回到2。

最悲惨的情况，分配触发多次psgc和多次fullgc，直到oom。

完整内存回收策略1）如gc所执行的时间超过，直接结束；2）先调用invoke_nopolicy2.1先检查是不是要尝试scavenge；2.1.1tospace必须为空，如不为空，则返回false；2.1.2获取之前所有minorgc晋级到old的平均大小，并对比目前eden+from已使用的大小，取更小的一个值，如老生代剩余空间小于此值，则返回false，如大于则返回true；2.2如不需要尝试scavenge，则返回false，否则继续；2.3多线程扫描活的对象，并基亍copying算法回收，回收时相应的晋升对象到旧生代；2.4如useadaptivesizepolicy，那么重新计算tospace和tenuringthreshold的值，并调整。3）如invoke_nopolicy返回的是false，或之前所有minorgc晋级到老生代的平均大小>旧生代的剩余空间，那么继续下面的步骤，否则结束；4）如useparalleloldgc，则执行psparallelcompact，如不是useparalleloldgc，则执行psmarksweep。

老生代并行cmsgc：

优缺点：

1）大部分时候和应用并发进行，因此只会造成很短的暂停时间；2）浮动垃圾，没办法，所以内存空间要稍微大一点；3）内存碎片，-xx:+usecmscompactatfullcollection来解决；4）争抢cpu，这gc方式就这样；5）多次remark，所以总的gc时间会比并行的长；6）内存分配，freelist方式，so性能稍差，对minorgc会有一点影响；7）和应用并发，有可能分配和回收同时，产生竞争，引入了锁，jvm分配优先。

11、tlab的解释

堆内的对象数据是各个线程所共享的，所以当在堆内创建新的对象时，就需要进行锁操作。锁操作是比较耗时，因此jvm为每个线在堆上分配了一块“自留地”——tlab(全称是threadlocalallocationbuffer)，位于堆内存的新生代，也就是eden区。每个线程在创建新的对象时，会首先尝试在自己的tlab里进行分配，如果成功就返回，失败了再到共享的eden区里去申请空间。在线程自己的tlab区域创建对象失败一般有两个原因：一是对象太大，二是自己的tlab区剩余空间不够。通常默认的tlab区域大小是eden区域的1%，当然也可以手工进行调整，对应的jvm参数是-xx:tlabwastetargetpercent。

参考文献：

1、sunjdk1.6gc（garbagecollector）作者：毕玄

内存管理与垃圾回收

订阅

站点更新提醒