解决Java调用Python代码返回中文乱码问题

解决Java调用Python代码返回中文乱码问题

一、乱码原因分析

在Java调用Python代码执行时遇到乱码,我们的第一反应可能是检查文件编码设置是否一致。但在本例中,无论是Java还是Python,编码格式均已设为“UTF-8”,因此排除了编码不一致的问题。乱码的真正原因,在于Python的print函数输出时所用的默认编码格式。

执行以下Python代码,我们可以查看print函数的默认编码:

import locale
print(locale.getdefaultlocale())

执行结果显示默认编码为('zh_CN', 'cp936'),其中“cp936”代表GB2312,即中文编码。

二、正确解决方案

经测试,有两种方法可有效解决中文乱码问题:一种是在Java代码中设置编码,另一种是在Python代码中设置。

2.1 方法1——在Java代码中设置编码格式

使用ProcessRuntime调用Python代码时,可以将获取到的输入流编码设置为"gb2312"。

try {
    String result = "";
    String exe = "python解释器所处的绝对路径";
    String py = "python代码文件绝对地址";
    Process process = Runtime.getRuntime().exec(exe + " " + py);
    InputStreamReader isr = new InputStreamReader(process.getInputStream(),"gb2312");
    LineNumberReader input = new LineNumberReader(isr);
    result = input.readLine();
    input.close();
    isr.close();
    
    int re = process.waitFor();
    System.out.println(result);
} catch (InterruptedException | IOException e) {
    System.out.println("调用python脚本并读取结果时出错:" + e.getMessage());
}

注意,不能读取完字节流后再用getByte重新编码,这会导致另一种乱码。

2.2 方法2——在Python代码中设置编码格式

当不确定Java中将以何种方式调用Python代码时(如不使用Process),可以直接在Python代码中设置编码格式:

import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')

经过上述设置后,乱码问题将得到有效解决。如果您有更好的解决方式,欢迎在评论区留言交流。


你可能感兴趣的:(python,java,开发语言)