C#中StreamReader读取中文出现乱码

有时在用C#中StreamReader读取中文时出现乱码

如:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Diagnostics;
using System.Net;
using System.Data.Sql;
using System.Collections;
using System.Data.SqlClient;
using System.IO;
using System.Diagnostics;


namespace ConsoleApplication1
{
    class Program
    {
        static void Main(string[] args)
        {
            try
            {
                FileStream fs = new FileStream("1.txt", FileMode.Open, FileAccess.Read);
                StreamReader read = new StreamReader(fs);
                string str;
                while (read.Peek() != -1)
                {
                    str = read.ReadLine();
                    Console.WriteLine(str);
                }
                read.Close();
            }
            catch (Exception ex)
            {
                Console.WriteLine(ex.Message);
            }
        }
    }
}



原因是自Windows 2000之后的操作系统在文件处理时默认编码采用Unicode

所以.NET文件的默认编码也是Unicode。除非另外指定,StreamReader的默认编码为Unicode,

而不是当前系统的ANSI代码页。但是文档大部分还是以ANSI编码存储,中文文本使用的是GB2312,所以才造成中文乱码

所以在读取文本的时候要指定编码格式。


使用System.Text.Encoding.Defaul告诉StreamReader采用目前操作系统的编码即可。

如:

 FileStream fs = new FileStream("1.txt", FileMode.Open, FileAccess.Read);
                StreamReader read = new StreamReader(fs, Encoding.Default);
                string str;
                while (read.Peek() != -1)
                {
                    str = read.ReadLine();
                    Console.WriteLine(str);
                }
                read.Close();









你可能感兴趣的:(C#中StreamReader读取中文出现乱码)