httpclient编码设置问题

dwd4 9年前
1、非流式读取

HttpClient中可以之间使用HttpMethod的getResponseBodyAsString()方法获取返回的内容,在读取之前,如果需要做编码设置可以这样:

HttpMethod get=new GetMethod(url);
httpClient.executeMethod(get);
get.getParams().setContentCharset("GBK");

这么做虽然可以解决中文乱码问题,但是在HttpClient 3.1中这种方法是不推荐的,会发出警告。

2、流式读取

 

HttpClient推荐使用流式的读取返回内容,如下:

 

BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream()));
String tmp=null;
String htmlRet="";
while((tmp=reader.readLine())!=null){
htmlRet+=tmp+"\r\n";
}
System.out.println(new String(htmlRet.getBytes(),"GB2312"));

但是经过尝试发现这样会出现中文乱码问题。经过N次实验后,将上面代码修改如下,乱码问题随之解决。

HttpClient httpClient=new HttpClient(); 
HttpMethod get=new GetMethod(send_url);

try {
httpClient.executeMethod(get);

//System.out.println(get.getResponseBodyAsString());

BufferedReader reader=new BufferedReader(new InputStreamReader(get.getResponseBodyAsStream(),"ISO-8859-1"));
String tmp=null;
String htmlRet=""; 
while((tmp=reader.readLine())!=null){
htmlRet+=tmp+"\r\n";
}

System.out.println(new String(htmlRet.getBytes("ISO-8859-1"),"GB2312"));

} catch (HttpException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}finally{
get.releaseConnection();
}