深入Java字符串

yj_0212 贡献于2012-05-26

作者 jingsi-qt  创建于2012-05-26 14:58:55   修改者  修改于1899-12-30 00:00:00字数5077

文档摘要:Java字符串类(java.lang.String)是Java中使用最多的类,也是最为特殊的一个类,很多时候,我们对它既熟悉又陌生。一、从根本上认识java.lang.String类和String池首先,我建议先看看String类的源码实现,这是从本质上认识String类的根本出发点。
关键词:

深入Java字符串 Java字符串类(java.lang.String)是Java中使用最多的类,也是最为特殊的一个类,很多时候,我们对它既熟悉又陌生。 一、从根本上认识java.lang.String类和String池 首先,我建议先看看String类的源码实现,这是从本质上认识String类的根本出发点。从中可以看到: 1、String类是final的,不可被继承。public final class String。 2、String类是的本质是字符数组char[], 并且其值不可改变。private final char value[]; 然后打开String类的API文档,可以发现: 3、String类对象有个特殊的创建的方式,就是直接指定比如String x = "abc","abc"就表示一个字符串对象。而x是"abc"对象的地址,也叫做"abc"对象的引用。 4、String对象可以通过“+”串联。串联后会生成新的字符串。也可以通过concat()来串联,这个后面会讲述。 6、Java运行时会维护一个String Pool(String池),JavaDoc翻译很模糊“字符串缓冲区”。String池用来存放运行时中产生的各种字符串,并且池中的字符串的内容不重 复。而一般对象不存在这个缓冲池,并且创建的对象仅仅存在于方法的堆栈区。下面是个系统内存示意图: 5、创建字符串的方式很多,归纳起来有三类: 其一,使用new关键字创建字符串,比如String s1 = new String("abc"); 其二,直接指定。比如String s2 = "abc"; 其三,使用串联生成新的字符串。比如String s3 = "ab" + "c"; 二、String对象的创建 String对象的创建也很讲究,关键是要明白其原理。 原理1:当使用任何方式来创建一个字符串对象s时,Java运行时(运行中JVM)会拿着这个X在String池中找是否存在内容相同的字符串对象,如果不存在,则在池中创建一个字符串s,否则,不在池中添加。 原理2:Java中,只要使用new关键字来创建对象,则一定会(在堆区或栈区)创建一个新的对象。 原理3:使用直接指定或者使用纯字符串串联来创建String对象,则仅仅会检查维护String池中的字符串,池中没有就在池中创建一个,有则罢了!但绝不会在堆栈区再去创建该String对象。 原理4:使用包含变量的表达式来创建String对象,则不仅会检查维护String池,而且还会在堆栈区创建一个String对象。 另外,String的intern()方法是一个本地方法,定义为public native String intern(); intern()方法的价值在于让开发者能将注意力集中到String池上。当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(该对象由 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并且返回此 String 对象的引用。 三、认识trim()、intern()和concat()、“+”。 三、认识空格、空串、null 下面看个例子: /** * Created by IntelliJ IDEA.
* User: leizhimin
* Date: 2008-6-2 22:14:16
* Note: Please add comment here! */ publicclassStringTest { public static void main(String args[]) { //在池中和堆中分别创建String对象"abc",s1指向堆中对象 String s1 = new String("abc"); //s2直接指向池中对象"abc" String s2 = "abc"; //在堆中新创建"abc"对象,s3指向该对象 String s3 = new String("abc"); //在池中创建对象"ab" 和 "c",并且s4指向池中对象"abc" String s4 = "ab" + "c"; //c指向池中对象"c" String c = "c"; //在堆中创建新的对象"abc",并且s5指向该对象 String s5 = "ab" + c; String s6 = "ab".concat("c"); String s7 = "ab".concat(c); System.out.println("------------实串-----------"); System.out.println(s1 == s2); //false System.out.println(s1 == s3); //false System.out.println(s2 == s3); //false System.out.println(s2 == s4); //true System.out.println(s2 == s5); //false System.out.println(s2 == s6); //false System.out.println(s2 == s7); //false String b1 = new String(""); String b2 = ""; String b3 = new String(""); String b4 = "".intern(); String b5 = "" + ""; String b6 = "".concat(""); String b7 = " ".trim(); String b8 = " "; String b9 = " ".trim(); System.out.println("------------空串-----------"); System.out.println(b1 == b2); //false System.out.println(b1 == b3); //false System.out.println(b2 == b3); //false System.out.println(b2 == b4); //true System.out.println(b2 == b5); //true* System.out.println(b2 == b6); //true* System.out.println(b2 == b7); //false* System.out.println("-----a----"); System.out.println(b2.equals(b7)); //true System.out.println(b7 == b8); //false System.out.println(b7 == b9); //false System.out.println(b7.equals(b9)); //true System.out.println(b9 == null);//false System.out.println("b8.trim():"); for (byte b : b8.getBytes()) { System.out.print(">>>" + (int) b + " "); } System.out.println("\nb8.trim():"); for (byte b : b8.trim().getBytes()) { System.out.print(">>>" + (int) b + " "); } System.out.println("\nb9.trim():"); for (byte b : b9.trim().getBytes()) { System.out.print(">>>" + (int) b + " "); } } } 四、String的常见用法 1、字符串重编码 这个问题说来比较简单,转码就一行搞定,不信你看看,但究竟为什么要转码,是个很深奥的问题,看例子: importjava.io.UnsupportedEncodingException; /** * 字符串转码测试 * * @author leizhimin 2009-7-17 10:50:06 */ publicclassTestEncoding { public static void main(String[] args) throws UnsupportedEncodingException { System.out.println("转码前,输出Java系统属性如下:"); System.out.println("user.country:" + System.getProperty("user.country")); System.out.println("user.language:" + System.getProperty("user.language")); System.out.println("sun.jnu.encoding:" + System.getProperty("sun.jnu.encoding")); System.out.println("file.encoding:" + System.getProperty("file.encoding")); System.out.println("---------------"); String s = "熔岩博客"; String s1 = new String(s.getBytes(), "UTF-8"); String s2 = new String(s.getBytes("UTF-8"), "UTF-8"); String s3 = new String(s.getBytes("UTF-8")); String s4 = new String(s.getBytes("UTF-8"), "GBK"); String s5 = new String(s.getBytes("GBK")); String s6 = new String(s.getBytes("GBK"), "GBK"); System.out.println(s1); System.out.println(s2); System.out.println(s3); System.out.println(s4); System.out.println(s5); System.out.println(s6); } } 输出结果: 转码前,输出Java系统属性如下: user.country:CN user.language:zh sun.jnu.encoding:GBK file.encoding:UTF-8 --------------- 熔岩博客 熔岩博客 熔岩博客 鐔斿博鍗氬 ���Ҳ��� 熔岩博客 Process finished with exit code 0 得出一结论: a、转一个码,又用该码来构建一个字符串,是绝对不会出现乱码的,----你相当于没转。 b、转码与否,与字符串本身编码有关,字符串本身的编码与谁有关?----文件编码,或者你的IDE设置的编码有关。 在此,我用的IDEA开发工具,默认是UTF-8编码,但操作系统使用的是GBK,但没有问题,我只要按照UTF-8来读取我的字符串就不会有 乱码。但是文件已经是UTF-8了,你非要转为GBK,不乱才怪!那有什么办法呢?在Windows下,用记事本或者Editplus打开后另存为(并修 改编码方式即可)。 至于已经要从UFT-8转换为GBK,这就要靠内码转换工具了,是个比较复杂的问题,如果有谁想研究可以告诉我,一块研究研究。 2、字符比较 不就是个匹配关系吗?String类的API有一些可以做比较,如果不行,可以寻求正则表达式来解决。 3、获取某个字符 获取一个字符序列toCharArray() ,然后就随便玩去吧,中文就乱了。 4、字符串的截取 substring() 5、字符串的替换与查找 参看http://lavasoft.blog.51cto.com/blog/62575/179324 6、开始结束判断 startsWith()/endWith() 7、字符串的排序比较 compareTo(String anotherString) 按字典顺序比较两个字符串。 compareToIgnoreCase(String str) 不考虑大小写,按字典顺序比较两个字符串。 8、字符串的equals()和hashCode() 已经实现了好了,直接调用,不用重写 9、字符串的类型转化 太多了,String.valueOf()系列很多。 类似的Long.parseLong(String s) 10、字符串的复制 copyValueOf() 11、大小写转换 toLowerCase() toUpperCase() 13、正则匹配 http://lavasoft.blog.51cto.com/blog/62575/179324

下载文档到电脑,查找使用更方便

文档的实际排版效果,会与网站的显示效果略有不同!!

需要 8 金币 [ 分享文档获得金币 ] 9 人已下载

下载文档