JDK源码之String、StringBuffer、StringBuilder

2019-11-15 00:33:07

字体：大中小

来源：转载

供稿：网友

就String而言，平时工作中用得最多，但是很多时候还是用不好，有必要对他进行整体的分析下。如果看过Thinking in java，再看下JDK的源码，很多东西就会变得十分明了。现在对String的底层实现进行下分析。

首先是对构造函数而言，我工作中最常用到的可能就是new String(str)这个构造函数了，所以再在此关注这一个。这个构造函数是对传进来的String进行解析，将其放进一个数组当中，我们设定为arrayOfChar，String类定义了全局变量offset(偏移量)，count(大小)，value(char类型的数组)，此时，会将offset设为0，count设置为arrayOfChar.length，value设置为arrayOfChar，此时整个String构造器完成了初始化工作，三个全局变量全部设定了初始值，当String类型的对象调用类中的方法时，其实就是对这三个变量进行的操作，下面的方法分析中会涉及到。在String的方法中，很多方法返回的都是新的String对象，原因是因为String初始化后，大小就固定了，如下面讲解到的方法SubString、concat等方法。

常用方法分析：1、最简单的isEmpty，底层也是很简单的一行代码，return this.count == 0，清晰明了，很好的完成了相应的功能。在此，就使用了构造器中的count。

　　　　　　　　2、charAt，获取指定下标的字符。之前说过，构造器将String处理成了一个数组，此时要想得到指定下标字符，就很easy了，直接使用数组中的[n]就可以拿到了，不过它加入了偏移量，之前做了简单的异常处理，防止数组越界。

　　　　　　　　3、equals将字符串与指定对象的比较，开发中最常用的方法之一。在方法开始，就做了一个判断，如果当前对象和指定对象一样，直接返回true，这里当前对象使用的是this关键字，如果不等于，则进行接下来的操作。当指定对象不是String类型（使用instanceof判断），直接返回false，如果是String类型，则取出当前对象的数组value和指定对象的数组value1，然后根据偏移量对数组进行逐个比较，若数组相等，则返回true，反之有任何一个元素不等，当即返回false。

　　　　　　　　4、compareTo将两个字符串按照字典顺序比较。返回负数,0,正数。其实底层实现方式跟equals相似，也是使用数组实现的。但是，他的逻辑却不一样，它会逐个拿到相同下标的数组元素，然后拿到字典顺序进行比较，如果相等，继续，如果不等，直接相减并return，这是就是正数或者负数了，如果全部相等，最后返回0。

　　　　　　　　5、startWith(String,int)判断字符串是否是已制定String开始，这里分析带两个参数的，原因是因为startWith(String),endsWith(String)都是调用这个方法实现的，这也进一步展现了代码重用性带来的方便，搞笑、简洁。它的实现依旧是使用数组，将参数String与当前对象数组逐个进行比较，最后得出结果。不过，第二个参数int说明了指定String要从当前对象数组中的哪个下标进行比较。 startWith(String)实际上默认给了startWith(String,int)中int的值为0，表明从数组下标为0的开始比较。endsWith(String)实际就是从数组下标为当前对象数组的长度-指定字符数组的长度进行比较。这样一来，所以的方法最后实现都是startWith(String,int)来实现的。这一点在工作中也应该使用，即代码的重用性，最后上升到代码的简洁。代码虽短（一行到两行），但是却十分完美的实现了其功能，且清晰明了。个人觉得，方法contains也可以使用startWith(String,int)方法来实现，JDK使用indexOf实现的，不过使用startWith需要循环，效率当然会低很多的。【此处我只是举一反三，考虑效率，肯定是indexOf好多了】。

　　　　　　　　6、substring(int1,int2)截取字符串，substring(int)调用前一个，不过第二个int2设置为当前对象数组的长度。它表示从下标int1到下标int2的元素取出来，如果缺失int2，默认为数组长度，最后的实现使用的是String的一个构造函数Stirng(int,int,char[])实现的，返回一个新的String对象。在这个构造函数中，对新的String对象初始化了，包括offset，count，value，这样截取的方法就返回了一个符合要求的全新的String对象。

　　　　　　　　7、其实还有concat、replace等比较常用的方法，但是，其底层都是针对数组进行的操作，以上讲了几个典型的，这几个就不在一一讲了，可以直接看源码，很容易就理解了。只不过这两个都是返回了全新的String对象，还使用了一些其他的方法，但是思想都差不多一样。其他还有很多常用方法如getChars(char[], int)，replaceAll(String, String)，split都是调用了相关类的方法，就不在这里讲了。

　　　　　　　　8、在String中有个静态内部类CaseInsensitiveComparator，此处还是看下比较好。这个类中只包含了一个方法compare，这个方法是比较连个字符串的，但是忽略其大小写。方法中使用charAt取出对应的数组元素，然后Character.toUpperCase进行转换比较，为了安全，他还使用了Character.toLowerCase进行转换比较，如果相等，进行下一个比较，如果不等，直接求差返回。这个静态内部类中的方法是不能在其他类中方法进行直接访问的，而必须要通过外部类的compareToIgnoreCase方法进行访问。这样做的目的，我个人认为是防止其他类直接访问静态类中的方法，有点类似代理模式，不过这点我还有疑惑，在下面的疑惑中我会提出。这种做法在遍历器中也用到了，不过在遍历器的做法稍有不同，那里的做法是返回内部类的对象，然后利用这个对象去访问内部类中的方法。

　　　　　　　　总体来说，String我就理解了这么多，了解了底层怎么实现的，在使用String方法时也就更加得心应手了。看完了底层实现，收获很多，但是也有很多疑惑，先将疑惑列出，希望知道的IT朋友们帮助解答。

　　　　　　疑惑：1、方法equalsIgnoreCase的实现为return (this == paramString)，为什么这样就可以忽略大小写？具体的实现方式是怎么样的？

　　　　　　　　　　　2、刚刚提到的内部类，为什么要使用内部类，我直接将内部类的方法设置为PRivate的，然后在相应的方法中调用，也能起到同样的效果，可能是我对内部类不了解，但是为什么要这样做？好处是什么？

　　　　　　　　　　　 3、hashCode方法给类的全局变量hash赋值了，但是在哪个地方使用到了呢？仅仅赋值而已？会不会跟String的==有关？有的话是什么关系？

续：StringBuffer、StringBuilder：

　　　　其实搞明白了String的相关方法，再回头看StringBuffer和StringBuilder，就会很easy了。其中很多方法的实现都差不多一样的，例如subString方法。之所以StringBuffer是安全的，是因为他的方法都有关键字synchronized，所以速度较慢，很多地方都推荐优先使用StringBuider。其实，看了他们的源码就知道了，他两的实现方式其实都是一样的，很多方法都是调用他们的父类方法AbstractStringBuilder的方法的。其实在这里分析AbstractStringBuilder类更为好，相当于分析了SB和SF两个类的实现。ASB类中的方法主要是insert和append，ASB类的对象不想String那样，大小后期可以动态更改的，原因是ASB维护的是数组，当数组大小不满足的时候，他会扩展数组的大小，不需要重新创建对象。所以说StringBuffer、StringBuilder的初始化以后，大小是可以动态变化的，原因就是底层维护的是数组，可以进行扩展，而不需要新的对象。当然Insert的原理也差不多一样，也是操作数组，所以大小是动态变化的。API文档中给这两个类的定义为：一个可变的字符序列。

　　　　想要弄清楚StringBuffer、StringBuilder，个人觉得弄清了String就行了，很多东西实现逻辑都一样，只是底层的实现稍微存在差别，所以导致在性能上有些不同而已。

总体的字符串就分析到这，理解了底层的实现，在日常工作中用得也就更加得心应手了。

以上纯属个人阅读JDK源码的理解，欢迎大虾们指出不对或者补充，同时对于疑惑部分肯定大家赐教，可以评论或者私信，也可以发邮件给我aaddi@sina.com，有什么好的学习方法，也可以随时交流。

欢迎各位IT朋友私信我，相互交流、学习！

上一篇：java中的clone

下一篇：一次项目部署所引发的思考