电脑故障

位置:IT落伍者 >> 电脑故障 >> 浏览文章

通过JVM原理理解字符串的比较


发布日期:2022/10/2
 

Java中的字符串也是一连串的字符但是与许多其他的计算机语言将字符串作为字符数组处理不同Java将字符串作为String类型对象来处理将字符串作为内置的对象处理允许Java提供十分丰富的功能特性以方便处理字符串

JVM运行时数据区的内存模型由五部分组成

()方法区

()堆

()JAVA栈

()PC寄存器

()本地方法栈

对于String s = haha 它的虚拟机指令

: ldc ; //String haha : astore_ : return

ldc指令格式

ldcindex

ldc指令过程要执行ldc指令JVM首先查找index所指定的常量池入口在index指向的JVM常量池入口JVM将会查找CONSTANT_Integer_infoCONSTANT_Float_info和CONSTANT_String_info入口如果还没有这些入口JVM会解析它们而对于上面的hahaJVM会找到CONSTANT_String_info入口同时将把指向被拘留String对象(由解析该入口的进程产生)的引用压入操作数栈

astore_指令格式

astore_

astore_指令过程要执行astore_指令JVM从操作数栈顶部弹出一个引用类型或者returnAddress类型值然后将该值存入由索引指定的局部变量中即将引用类型或者returnAddress类型值存入局部变量

return 指令的过程

从上面的ldc指令的执行过程可以得出s的值是来自被拘留String对象(由解析该入口的进程产生)的引用即可以理解为是从被拘留String对象的引用复制而来的故我个人的理解是s的值是存在栈当中上面是对于s值得分析接着是对于haha值的分析我们知道对于String s = haha 其中haha值在JAVA程序编译期就确定下来了的简单一点说就是haha的值在程序编译成class文件后就在class文件中生成了(大家可以用UE编辑器或其它文本编辑工具在打开class文件后的字节码文件中看到这个haha值)执行JAVA程序的过程中第一步是class文件生成然后被JVM装载到内存执行那么JVM装载这个class到内存中其中的haha这个值在内存中是怎么为其开辟空间并存储在哪个区域中呢?

JVM常量池

虚拟机必须为每个被装载的类型维护一个常量池常量池就是该类型所用到常量的一个有序集和包括直接常量(stringinteger和floating point常量)和对其他类型字段和方法的符号引用对于String常量它的值是在常量池中的而JVM常量池在内存当中是以表的形式存在的对于String类型有一张固定长度的CONSTANT_String_info表用来存储文字字符串值注意该表只存储文字字符串值不存储符号引用说到这里对JVM常量池中的字符串值的存储位置应该有一个比较明了的理解了

在介绍完JVM常量池的概念后接着谈开始提到的haha的值的内存分布的位置对于haha的值实际上是在class文件被JVM装载到内存当中并被引擎在解析ldc指令并执行ldc指令之前JVM就已经为haha这个字符串在常量池的CONSTANT_String_info表中分配了空间来存储haha这个值

既然haha这个字符串常量存储在常量池中常量池是属于类型信息的一部分类型信息也就是每一个被转载的类型这个类型反映到JVM内存模型中是对应存在于JVM内存模型的方法区中也就是这个类型信息中的JVM常量池概念是存在于在方法区中而方法区是在JVM内存模型中的堆中由JVM来分配的所以haha的值是应该是存在堆空间中的而对于String s = new String(haha) 它的JVM指令

:new;//classString

:dup

:ldc;//Stringhaha

:invokespecial;//Methodjava/lang/String:(Ljava/lang/String;)V

:astore_

:return

new指令格式new indexbyteindexbyte

new指令过程

要执行new指令Jvm通过计算(indextype<<)|indextype生成一个指向常量池的无符号位索引然后JVM根据计算出的索引查找JVM常量池入口该索引所指向的常量池入口必须为CONSTANT_Class_info如果该入口尚不存在那么JVM将解析这个常量池入口该入口类型必须是类JVM从堆中为新对象映像分配足够大的空间并将对象的实例变量设为默认值最后JVM将指向新对象的引用objectref压入操作数栈

dup指令格式dup

dup指令过程

要执行dup指令JVM复制了操作数栈顶部一个字长的内容然后再将复制内容压入栈本指令能够从操作数栈顶部复制任何单位字长的值但绝对不要使用它来复制操作数栈顶部任何两个字长(long型或double型)中的一个字长上面例中即复制引用objectref这时在操作数栈存在个引用

ldc指令格式ldcindex

ldc指令过程

要执行ldc指令JVM首先查找index所指定的常量池入口在index指向的JVM常量池入口JVM将会查找CONSTANT_Integer_infoCONSTANT_Float_info和CONSTANT_String_info入口如果还没有这些入口JVM会解析它们而对于上面的hahaJVM会找到CONSTANT_String_info入口同时将把指向被拘留String对象(由解析该入口的进程产生)的引用压入操作数栈

invokespecial指令格式invokespecialindextypeindextype

invokespecial指令过程对于该类而言该指令是用来进行实例初始化方法的调用上面例子中即通过其中一个引用调用String类的构造器初始化对象实例让另一个相同的引用指向这个被初始化的对象实例然后前一个引用弹出操作数栈

astore_指令格式astore_

astore_指令过程

要执行astore_指令JVM从操作数栈顶部弹出一个引用类型或者returnAddress类型值然后将该值存入由索引指定的局部变量中即将引用类型或者returnAddress类型值存入局部变量

return 指令的过程:

从方法中返回返回值为void要执行astore_指令JVM从操作数栈顶部弹出一个引用类型或者returnAddress类型值然后将该值存入由索引指定的局部变量中即将引用类型或者returnAddress类型值存入局部变量

通过上面个指令可以看出String s = new String(haha);中的haha存储在堆空间中而s则是在操作数栈中上面是对s和haha值的内存情况的分析和理解;那对于String s = new String(haha);语句到底创建了几个对象呢?这里haha本身就是JVM常量池中的一个对象而在运行时执行new String()时将JVM常量池中的对象复制一份放到堆中并且把堆中的这个对象的引用交给s持有所以这条语句就创建了个String对象下面是一些String相关的常见问题

String中的final用法和理解

final StringBuffer a = new StringBuffer(); final StringBuffer b = new StringBuffer(); a=b;//此句编译不通过 final StringBuffer a = new StringBuffer(); aappend();//编译通过

可见final只对引用的(即内存地址)有效它迫使引用只能指向初始指向的那个对象改变它的指向会导致编译期错误至于它所指向的对象的变化final是不负责的

String 常量池问题的几个例子

下面是几个常见例子的比较分析和理解

finalStringBuffera=newStringBuffer();

finalStringBufferb=newStringBuffer();

a=b;//此句编译不通过

finalStringBuffera=newStringBuffer();

aappend();//编译通过

分析JVM对于字符串常量的+号连接将程序编译期JVM就将常量字符串的+连接优化为连接后的值a + 来说经编译器优化后在class中就已经是a在编译期其字符串常量的值就确定下来故上面程序最终的结果都为true

Stringa=ab;

Stringbb=b;Stringb=a+bb;

Systemoutprintln((a==b));

//result=false

分析JVM对于字符串引用由于在字符串的+连接中有字符串引用存在而引用的值在程序编译期是无法确定的a + bb无法被编译器优化只有在程序运行期来动态分配并将连接后的新地址赋给b所以上面程序的结果也就为false

Stringa=ab;

finalStringbb=b;

Stringb=a+bb;

Systemoutprintln((a==b));

//result=true

分析和[]中唯一不同的是bb字符串加了final修饰对于final修饰的变量它在编译时被解析为常量值的一个本地拷贝存储到自己的常量池中或嵌入到它的字节码流中所以此时的a + bb和a + b效果是一样的故上面程序的结果为true

Stringa=ab;finalStringbb=getBB();

Stringb=a+bb;

Systemoutprintln((a==b));

//result=falseprivatestaticStringgetBB(){returnb;}

分析JVM对于字符串引用bb它的值在编译期无法确定只有在程序运行期调用方法后将方法的返回值和a来动态连接并分配地址为b故上面程序的结果为false通过上面个例子可以得出得知

Strings=a+b+c;

就等价于Strings=abc;

Stringa=a;Stringb=b;

Stringc=c;

Strings=a+b+c;

这个就不一样了最终结果等于

StringBuffertemp=newStringBuffer();

tempappend(a)append(b)append(c);

Strings=temptoString();

由上面的分析结果可就不难推断出String 采用连接运算符(+)效率低下原因分析形如这样的代码

publicclassTest{publicstaticvoidmain(Stringargs[]){

Strings=null;

for(inti=;i<;i++){s+=a;}}}

每做一次 + 就产生个StringBuilder对象然后append后就扔掉下次循环再到达时重新产生个StringBuilder对象然后 append 字符串如此循环直至结束 如果我们直接采用 StringBuilder 对象进行 append 的话我们可以节省 N 次创建和销毁对象的时间所以对于在循环中要进行字符串连接的应用一般都是用StringBuffer或StringBulider对象来进行append操作String对象的intern方法理解和分析

publicclassTest{

privatestaticStringa=ab;

publicstaticvoidmain(String[]args){

Strings=a;

Strings=b;

Strings=s+s;

Systemoutprintln(s==a);//false

Systemoutprintln(sintern()==a);//true

}

}

这里用到Java里面是一个常量池的问题对于s+s操作其实是在堆里面重新创建了一个新的对象s保存的是这个新对象在堆空间的的内容所以s与a的值是不相等的而当调用sintern()方法却可以返回s在JVM常量池中的地址值因为a的值存储在常量池中故sintern和a的值相等

上一篇:探索空类的应用和性能分支

下一篇:我来说说Bean的使用方法