java检测网络或本地文件字符编码(解决乱码)

相信很多人在编码时遇到乱码问题,现在介绍一种检测字符编码的方法


File file=new File(filename);
FileInputStream read=new FileInputStream(file);
SAXParserFactory factory=SAXParserFactory.newInstance();
SAXParser parser=factory.newSAXParser();
	    		/*------------------------------------------------------------------------ 
	    		  detector是探测器,它把探测任务交给具体的探测实现类的实例完成。 
	    		  cpDetector内置了一些常用的探测实现类,这些探测实现类的实例可以通过add方法 
	    		  加进来,如ParsingDetector、 JChardetFacade、ASCIIDetector、UnicodeDetector。   
	    		  detector按照“谁最先返回非空的探测结果,就以该结果为准”的原则返回探测到的 
	    		  字符集编码。 
	    		--------------------------------------------------------------------------*/ 
CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();
	    		/*------------------------------------------------------------------------- 
	    		  ParsingDetector可用于检查HTML、XML等文件或字符流的编码,构造方法中的参数用于 
	    		  指示是否显示探测过程的详细信息,为false不显示。 
	    		---------------------------------------------------------------------------*/  
detector.add(new ParsingDetector(false));
	    		/*-------------------------------------------------------------------------- 
	    		  JChardetFacade封装了由Mozilla组织提供的JChardet,它可以完成大多数文件的编码 
	    		  测定。所以,一般有了这个探测器就可满足大多数项目的要求,如果你还不放心,可以 
	    		  再多加几个探测器,比如下面的ASCIIDetector、UnicodeDetector等。 
	    		 ---------------------------------------------------------------------------*/
detector.add(JChardetFacade.getInstance());
		    	//ASCIIDetector用于ASCII编码测定  
detector.add(ASCIIDetector.getInstance());  
		    	//UnicodeDetector用于Unicode家族编码的测定  
detector.add(UnicodeDetector.getInstance());
		    	//得到编码字符集对象
Charset charset=detector.detectCodepage(file.toURI().toURL());
需要导入java包“cpdetector”


你可能感兴趣的:(java检测网络或本地文件字符编码(解决乱码))