下面一段话是我转载自csdn论坛里的
经验总结--字符串与编码:
首先应该把字节数组看成是String的载体。
dot Net使用的字符串String是Unicode编码的;它也是以Unicode编码的形式显示字符串。
以下是用自己语言对几个常用函数的说明:
(自己总结的,反正看不明MSDN)
bytes=System.Text.Encoding.Unicode.GetBytes(str)
作用:把str的载体作Unicode-> Unicode的编码转换--也就是没有对载体作任何的转换。因些使用此函数可以得代表该String载体的字节数组。
str=System.Text.Encoding.Unicode.GetString(bytes)
作用:对字节数组作Unicode-> Unicode的编码转换--即没有转换,把经过转换后的字节数组作为str的载体。
bytes=System.Text.Encoding.Utf8.GetBytes(str)
作用:把str的载体作Utf8-> Unicode的编码转换。返回的是经过转换后的字符数组
str=System.Text.Encoding.Utf8.GetString(bytes)
作用:对字节数组作Gb2312-> Unicode的编码转换,把经过转换后的字节数组作为str的载体。
bytes=System.Text.Encoding.GetEncoding( "GB2312 ").GetBytes(str)
作用:把str的载体作Gb2312-> Unicode的编码转换。返回的是经过转换后的字符数组
str=System.Text.Encoding.GetEncoding( "GB2312 ").GetString(bytes)
作用:对字节数组作Gb2312-> Unicode的编码转换,把经过转换后的字节数组作为str的载体。
如此类推
bytes=System.Text.Encoding.GetEncoding( "XXX ").GetBytes(str)
作用:把str的载体作XXX-> Unicode的编码转换。返回的是经过转换后的字符数组
str=System.Text.Encoding.GetEncoding( "XXX ").GetString(bytes)
作用:对字节数组作XXX-> Unicode的编码转换,把经过转换后的字节数组作为str的载体。
下面是我将这些做对比的一个例子
从上面结果我们可以看出无论是英文或中文字符,Unicode编码都是用两个字节来存储一个字符
UTF8编码则是一个字节储存一个英文字符,三个字节来存储一个中文字符
ASCII编码则不能用于中文编码
例子的完整代码如下:
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
namespace 字符串跟字节数组的互相转换
{
public partial class Form1 : Form
{
public Form1()
{
InitializeComponent();
}
private void button1_Click(object sender, EventArgs e)
{
string str = textBox1.Text;
//编码的GetBytes方法是将字符串编码成字节数组
byte[] ascii = Encoding.ASCII.GetBytes(str);
//编码的GetCharCount方法是字节数组的字符长度
char[] asciiChar = new char[Encoding.ASCII .GetCharCount (ascii,0,ascii .Length )];
//编码的GetChars方法(5个参数的)是获取字节数组的字符并把它赋给另一个字符数组
Encoding.ASCII.GetChars(ascii,0,ascii .Length ,asciiChar ,0);
//字符数组编程字符串
string asciiStr = new string(asciiChar);
textBox2.Text = ascii.Length + " " + asciiStr;
textBox3.Text = Encoding.ASCII.GetString(ascii );
byte[] unicode = System.Text.Encoding.Unicode.GetBytes(str);
char [] unicodeChar=new char[System .Text .Encoding .Unicode.GetCharCount(unicode ,0,unicode.Length )];
Encoding.Unicode.GetChars(unicode ,0,unicode .Length ,unicodeChar ,0);
string unicodeStr = new string(unicodeChar);
textBox4.Text = unicode.Length + " " + unicodeStr;
textBox5.Text = System.Text.Encoding.Unicode.GetString(unicode );
byte[] utf8 = System.Text.Encoding.UTF8.GetBytes(str);
char[] utf8Char=new char[Encoding .UTF8 .GetCharCount (utf8 ,0,utf8.Length )];
Encoding.UTF8.GetChars(utf8 ,0,utf8 .Length ,utf8Char ,0);
string utf8Str = new string(utf8Char );
textBox6.Text = utf8.Length + " " + utf8Str;
textBox7.Text = Encoding.UTF8.GetString(utf8 );
}
}
}
http://blog.163.com/tianjunqiang666@126/blog/static/872591192012101511303449/