Java中以字符流形式操作文件中的编码问题

参考 《编码解码模型和实现》,以字符流形式操作文件的时候,一定要指定正确的编码方案,否则会出现乱码等问题。

以字符流形式操作文件包括两种情形:以字符流的形式读取文件内容,将字符流写入文件中。


一、以字符流的形式读取文件内容
现在有一个文件a.txt,文件内容为“你好,Java程序”,采用UTF-8编码。接下来做2个实验。

1、实验1

实验代码:

package com.dslztx;


import java.io.*;
import java.nio.charset.Charset;


public class Encoding {
    public static void main(String[] args) throws IOException {
        BufferedReader reader =
                new BufferedReader(new InputStreamReader(new FileInputStream("a.txt"), Charset.forName("utf-8")));
        String line;
        while ((line = reader.readLine()) != null)
            System.out.println(line);
    }
}

实验结果:



2、实验2

实验代码:

package com.dslztx;


import java.io.*;
import java.nio.charset.Charset;


public class Encoding {
    public static void main(String[] args) throws IOException {
        BufferedReader reader =
                new BufferedReader(new InputStreamReader(new FileInputStream("a.txt"), Charset.forName("gbk")));
        String line;
        while ((line = reader.readLine()) != null)
            System.out.println(line);
    }
}

实验结果:




现在有一个文件b.txt,文件内容如下,采用UTF-8编码。接下来做2个实验。

你好
你好这是第一行
#Footer
Java程序
你好这是第二行


3、实验3

实验代码:
package com.dslztx;


import java.io.*;
import java.nio.charset.Charset;
import java.util.Scanner;


public class Encoding {
    public static void main(String[] args) throws IOException {
        Scanner scanner = new Scanner(new File("b.txt"), "utf-8");
        scanner.useDelimiter("\\r\\n#Footer\\r\\n");
        while (scanner.hasNext())
            System.out.println(scanner.next());
    }
}

实验结果:

Java中以字符流形式操作文件中的编码问题_第1张图片


4、实验4

实验代码:
package com.dslztx;


import java.io.*;
import java.nio.charset.Charset;
import java.util.Scanner;


public class Encoding {
    public static void main(String[] args) throws IOException {
        Scanner scanner = new Scanner(new File("b.txt"), "gbk");
        scanner.useDelimiter("\\r\\n#Footer\\r\\n");
        while (scanner.hasNext())
            System.out.println(scanner.next());
    }
}

实验结果:


分析:

由于乱码,导致scanner.hasNext()返回值为false


二、将字符流写入文件中
将字符流写入文件中,做2个实验。
1、实验1
实验代码:
package com.dslztx;


import java.io.*;
import java.nio.charset.Charset;
import java.util.Scanner;


public class Encoding {
    public static void main(String[] args) throws IOException {
        BufferedWriter writer =
                new BufferedWriter(new OutputStreamWriter(new FileOutputStream("c.txt"), Charset.forName("utf-8")));
        writer.write("你好,Java程序");
        writer.close();
    }
}
实验结果:

查看c.txt文件的字节流如下图所示



2、实验2

实验代码:
package com.dslztx;


import java.io.*;
import java.nio.charset.Charset;
import java.util.Scanner;


public class Encoding {
    public static void main(String[] args) throws IOException {
        BufferedWriter writer =
                new BufferedWriter(new OutputStreamWriter(new FileOutputStream("c.txt"), Charset.forName("gbk")));
        writer.write("你好,Java程序");
        writer.close();
    }
}
实验结果:


当没有明确指定需要使用的字符编码方案时,Java程序通过“java.nio.charset.Charset.defaultCharset().name()”语句来获取默认的字符编码方案,该语句返回的值跟运行Java程序的操作系统的设置有关,在有些操作系统上,该语句返回值可能是UTF-8;在有些操作系统上,该语句返回值可能是GBK;在有些操作系统上,该语句返回值可能是除了UTF-8和GBK以外的其他字符编码方案。这样子,程序的可移植性大大降低。

你可能感兴趣的:(Java中以字符流形式操作文件中的编码问题)