嵌套For循环性能优化案例

摘要:
4.1测试代码Java代码publicstaticvoidtestFunction{System.out.print(“”);//注意:此方法不影响整体优化,此处仅简单输出}publicstaticoidtestA(){longstart=System.anoTime();forfortestFunction;System.out.println;}publicstaticvoidtestB(){longstart=System.anoTime();forfortestFunction;System.out.println;}publicstaticvoidtestC(){longstart=System.nanoTime();inti;intj;intk;forforfortestFunction;System.out.println;}4.2测试结果1.测试机器配置:PentiumDual-CoreCPUE5400@2.70GHz2.70GHz,2GB内存;2.循环变量i、j和k的循环数分别为10、100和1000。进行了五组测试。测试结果如下:原方案17184627117325016617391087701731998751773725328,方案I 16883931216846601683716168310190168041251,方案II 16800183816914149061682306551694217661688240748,从以上测试结果来看,优化后的方案性能明显优于原方案,达到了优化效果。
1 案例描述
某日,在JavaEye上看到一道面试题,题目是这样的:请对以下的代码进行优化
Java代码  收藏代码
  1. for (int i = 0; i < 1000; i++)  
  2.     for (int j = 0; j < 100; j++)  
  3.         for (int k = 0; k < 10; k++)  
  4.             testFunction (i, j, k);  

(注:为了同后面的内容一致,这里对原题目进行了部分修改)

2 案例分析
从给出的代码可知,不论如何优化,testFunction执行的次数都是相同的,该部分不存在优化的可能。那么,代码的优化只能从循环变量i、j、k的实例化、初始化、比较、自增等方面的耗时上进行分析。
首先,我们先分析原题代码循环变量在实例化、初始化、比较、自增等方面的耗时情况:
变量实例化(次数)初始化(次数)比较(次数)自增(次数)
i1110001000
j100010001000 * 1001000 * 100
k1000 * 1001000 * 1001000 * 100 * 101000 * 100 * 10

(注:由于单次耗时视不同机器配置而不同,上表相关耗时采用处理的次数进行说明)
该代码的性能优化就是尽可能减少循环变量i、j、k的实例化、初始化、比较、自增的次数,同时,不能引进其它可能的运算耗时。

3 解决过程
从案例分析,对于原题代码,我们提出有两种优化方案:
3.1 优化方案一
代码如下:
Java代码  收藏代码
  1. for (int i = 0; i < 10; i++)  
  2.     for (int j = 0; j < 100; j++)  
  3.         for (int k = 0; k < 1000; k++)  
  4.             testFunction (k, j, i);  

该方案主要是将循环次数最少的放到外面,循环次数最多的放里面,这样可以最大程度的(注:3个不同次数的循环变量共有6种排列组合情况,此种组合为最优)减少相关循环变量的实例化次数、初始化次数、比较次数、自增次数,方案耗时情况如下:
变量实例化(次数)初始化(次数)比较(次数)自增(次数)
i111010
j101010 * 10010 * 100
k10 * 10010 * 10010 * 100 * 100010 * 100 * 1000


3.2 优化方案二
代码如下:
Java代码  收藏代码
  1. int i, j, k;  
  2. for (i = 0; i < 10; i++)  
  3.     for (j = 0; j < 100; j++)  
  4.         for (k = 0; k < 1000; k++)  
  5.             testFunction (k, j, i);  

该方案在方案一的基础上,将循环变量的实例化放到循环外,这样可以进一步减少相关循环变量的实例化次数,方案耗时情况如下:
变量实例化(次数)初始化(次数)比较(次数)自增(次数)
i111010
j11010 * 10010 * 100
k110 * 10010 * 100 * 100010 * 100 * 1000


4 解决结果
那么,提出的优化方案是否如我们分析的那样有了性能上的提升了呢?我们编写一些测试代码进行验证,数据更能说明我们的优化效果。
4.1 测试代码
Java代码  收藏代码
  1. public static void testFunction(int i, int j, int k) {  
  2.         System.out.print("");   // 注:该方法不影响整体优化,这里只有简单输出  
  3.     }  
  4.   
  5.     public static void testA() {  
  6.         long start = System.nanoTime();  
  7.         for (int i = 0; i < 1000; i++)  
  8.             for (int j = 0; j < 100; j++)  
  9.                 for (int k = 0; k < 10; k++)  
  10.                     testFunction(i, j, k);  
  11.         System.out.println("testA time>>" + (System.nanoTime() - start));  
  12.     }  
  13.   
  14.     public static void testB() {  
  15.         long start = System.nanoTime();  
  16.         for (int i = 0; i < 10; i++)  
  17.             for (int j = 0; j < 100; j++)  
  18.                 for (int k = 0; k < 1000; k++)  
  19.                     testFunction(k, j, i);  
  20.         System.out.println("testB time>>" + (System.nanoTime() - start));  
  21.     }  
  22.   
  23.     public static void testC() {  
  24.         long start = System.nanoTime();  
  25.         int i;  
  26.         int j;  
  27.         int k;  
  28.         for (i = 0; i < 10; i++)  
  29.             for (j = 0; j < 100; j++)  
  30.                 for (k = 0; k < 1000; k++)  
  31.                     testFunction(k, j, i);  
  32.         System.out.println("testC time>>" + (System.nanoTime() - start));  
  33. }  

4.2 测试结果
1、测试机器配置:Pentium(R) Dual-Core CPU E5400 @2.70GHz 2.70GHz, 2GB内存;
2、循环变量i、j、k循环次数分别为10、100、1000,进行5组测试,测试结果如下:
 第1组第2组第3组第4组第5组
原方案171846271173250166173910870173199875173725328
方案一168839312168466660168372616168310190168041251
方案二168001838169141906168230655169421766168240748

从上面的测试结果来看,优化后的方案明显性能优于原方案,达到了优化的效果。但优化方案二并没有如我们预期的优于方案一,其中第2、4、5组的数据更是比方案一差,怀疑可能是循环次数太少,以及测试环境相关因素影响下出现的结果。

3、重新调整循环变量i、j、k循环次数分别为20、200、2000,进行5组测试,测试结果如下:
 第1组第2组第3组第4组第5组
原方案13553972031358978176135812828113501936821354786598
方案一13434827041348410388134397803713479191561340697793
方案二13424275281343897887134266246213421240481336266453

从上面的测试结果来看,优化后的方案基本符合我们的预期结果。

5 总结
从案例分析和解决过程中的三个表的分析可知,优化方案一和优化方案二的性能都比原代码的性能好,其中优化方案二的性能是最好的。在嵌套For循环中,将循环次数多的循环放在内侧,循环次数少的循环放在外侧,其性能会提高;减少循环变量的实例化,其性能也会提高。从测试数据可知,对于两种优化方案,如果在循环次数较少的情况下,其运行效果区别不大;但在循环次数较多的情况下,其效果就比较明显了。

6 参考资料
[1] http://www.javaeye.com/topic/762312
[2] http://www.javaeye.com/topic/632481

免责声明:文章转载自《嵌套For循环性能优化案例》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Makefile系列之三 : 变量svn文件冲突,树冲突详解下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

2.2优化编译器的能力和局限性

写程序最主要的目标是使他在所有的可能的情况下都能正确工作。程序应该写出清晰简单的代码,主要为了给后期维护,起作用;但常常我们在程序的简单性,维护性,与程序的运行速度进行权衡; 高效的程序需要几类活动: (1)必须选择一组合适的算法和数据结构; (2)必须编写出编译器能够优化以转换成高效可执行的源代码,因此理解优化编译器的能力和局限性很重要,因此程序即使是很...

PLSQL_性能优化系列13_Oracle Index Rebuild索引重建

2014-10-04 Created By BaoXinjian 一、摘要 索引重建是一个争论不休被不断热烈讨论的议题。当然Oracle官方也有自己的观点,我们很多DBA也是遵循这一准则来重建索引,那就是Oracle建议对于索引深度超过4级以及已删除的索引条目至少占有现有索引条目总数的20% 这2种情形下需要重建索引。近来Oracle也提出了一些与之相反...

Java 性能优化的 50 个细节

在JAVA程序中,性能问题的大部分原因并不在于JAVA语言,而是程序本身。养成良好的编码习惯非常重要,能够显著地提升程序性能。 #尽量在合适的场合使用单例 使用单例可以减轻加载的负担,缩短加载的时间,提高加载的效率,但并不是所有地方都适用于单例 简单来说,单例主要适用于以下三个方面: 控制资源的使用,通过线程同步来控制资源的并发访问; 控制实例的产生,以...

【Vuejs】269- 提升90%加载速度——vuecli下的首屏性能优化

前言 之前用 vuecli做了个博客,是一个单页面项目,大概有十个路由直接 npm run build打包出来,有一个 1M的巨大 js文件 先挂载到服务器上试试好家伙 这加载时间 仿佛过了半个世纪 首屏页面整整加载了 9s 光加载那个大文件就花了 8s这必须得做个优化了,没有用户能忍受 9s的白屏而不关闭页面的 过程中,我还顺便把项目从 vuec...

Google的Web性能优化新方法——Diffable

来源于InfoQ: Google Maps的开发人员Josh和James最近提出并实现了一种Web性能优化新方法——Diffable, 即在浏览器加载Web页面时,促使其比较相关文件(Html、JavaScript等)在服务器端和客户端缓存区的版本并只下载差量(Deltas),降 低网络下载造成的延迟。本文简要介绍了Diffable方法的背景、原理、优势和...

富文本编辑器UEditor自定义工具栏(一、基础配置与字体、背景色、行间距、超链接实现)

导读:UEditor 是由百度「FEX前端研发团队」开发的所见即所得富文本web编辑器,功能强大,可定制,是一款优秀的国产在线富文本编辑器,编辑器内可插入图片、音频、视频等。 一、UEditor自定义工具栏效果图如下: 二、UEditor富文本编辑器环境搭建及项目引用 环境搭建不再赘述,请自行查阅或者参考以下链接 1.UEditor官网:http://u...