java中对Byte字符数组定长截取的方法

oluckly

2012-08-14

今天在在处理从网络上接收到的字符串，因为是从后台C语言过来的一组拼接的字符串，要定长截取，然而由于C语言是用Byte的方式计数，而java中是用Unicode编码的方式计数，一个中文汉字以Bytes的方式是两个字节，而用Unicode的方式是一个字，所以难以准确的截取出我想到的内容，经过半天的探索发现应该以如下的方式来解决。

先将字符串转换为Bytes【】数组，编码方式为“Unicode”，转出来的数组中的第一位和第二位是-2和-1，真正的内容从第三位开始，所有的字符都占用两个字节的空间，如果是英文和字母则第一个空间为0，如果是汉字就不是0，通过这样的方法就可以正确处理截取字符串的内容了！

public static String bSubstring(String s, int length) throws Exception  
	{  
	  
	    byte[] bytes = s.getBytes("Unicode");  
	    int n = 0; // 表示当前的字节数  
	    int i = 2; // 要截取的字节数，从第3个字节开始  
	    for (; i < bytes.length && n < length; i++)  
	    {  
	        // 奇数位置，如3、5、7等，为UCS2编码中两个字节的第二个字节  
	        if (i % 2 == 1)  
	        {  
	            n++; // 在UCS2第二个字节时n加1  
	        }  
	        else  
	        {  
	            // 当UCS2编码的第一个字节不等于0时，该UCS2字符为汉字，一个汉字算两个字节  
	            if (bytes[i] != 0)  
	            {  
	                n++;  
	            }  
	        }  
	    }  
	    // 如果i为奇数时，处理成偶数  
	    if (i % 2 == 1)  
	  
	    {  
	        // 该UCS2字符是汉字时，去掉这个截一半的汉字  
	        if (bytes[i - 1] != 0)  
	            i = i - 1;  
	        // 该UCS2字符是字母或数字，则保留该字符  
	        else  
	            i = i + 1;  
	    }  
	  
	    return new String(bytes, 0, i, "Unicode");  
	}

转:http://blog.csdn.net/lifvc/article/details/6760018

字符数组 unicode 字符数组

安科网

java中对Byte字符数组定长截取的方法

oluckly

oluckly

相关推荐

C语言中申请字符数组内存，并为其赋值后无法使用 free 释放

C语言中的数组(数组、字符数组)--C语言05

C 语言入门---第六章 C语言数组

JavaScript基础第二节

c语言之字符指针变量和字符数组的异同

只用这 6 个字符，就可以写出任意 JavaScript 代码！

C语言字符指针和字符数组的区别

C语言数组中字符串的旋转（左旋与右旋）

前端系列——查找字符串B的字符任意一种组合是否是字符串A的子串

[笔记] 深入理解 JavaScript Array.sort()

c语言中的字符数组与字符串

C语言内存管理-字符数组与字符指针

C语言中字符串处理函数介绍

关于PHP数组转字符串详细介绍

C#数组和串操作经验总结

C语言字符数组和字符串

php把字符串指定字符分割成数组的方法

C语言和Java字符串与字符数组区别

php像数组一样存取和修改字符串字符

通过PHP current函数获取未知字符键名数组第一个元素的值

oluckly