jsp中文乱码现象解决办法

╰+哭是因爲堅強的太久メ 2022-05-28 11:43 308阅读 0赞

之前总是碰到JSP页面乱码的问题,每次都是现在网上搜,然后胡乱改,改完也不明白原因。

这次正好作下总结,中文乱码就是因为编码不符,可能出现乱码有5个地方:

1 JSP编码乱码

2 HTML编码乱码

3 request获取数据乱码

4 response输出信息乱码

5 Cookie导致的编码问题

下面将会对上面几种情况进行介绍:

1. JSP乱码

   这种是最常见的,设置编码的位置位于JSP的第一行,如果在Eclipse中新建一个JSP默认是下面这种:

  1. <%@ page language="java" contentType="text/html; charset=ISO-8859-1" pageEncoding="ISO-8859-1"%>

   可以看到它默认的页面编码和传输编码都是ISO-8859-1,这是用于欧洲国家的编码。

  可以通过设置Eclipse中JSP的编码格式,来修改默认生成的编码格式。

format_png

如果想要支持中文,可以使用UTF-8、GB2312、GBK等,其中UTF-8是国际化的,哪个国家的都支持,所以推荐使用这个。

  再来说说上面涉及到编码的两个地方:charset 和 pageEncoding

  charset是指服务器发往客户端展现时的编码;

  pageEncoding用于设置JSP页面本身的编码。

JSP在部署后提供给用户使用,会经过三个阶段:

  1 JSP生成java文件:这个阶段会使用pageEncoding所定义的编码格式进行转换

  2 java文件生成class文件:这个阶段由服务器tomcat自动使用utf-8编码把java文件转换成字节码class文件  

  3 通过读取class文件展现给用户:这个阶段由tomcat服务器获取字节码内容,通过使用contentType所定义的编码格式展现给用户。

  大致过程如下图:

format_png 1

这样设置好JSP中的第一行代码,就可以保证基本的JSP展现没有乱码了!

  1. <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>

2. HTML乱码

因为JSP中也包含HTML的内容,HTML本身也是有编码格式的。

  1. <html>
  2. <head>
  3. <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  4. <title>Insert title here</title>
  5. </head>
  6. <body>
  7. </body>
  8. </html>

如果这部分编码出现问题,那么HTML中标签的中文命名就会出现乱码。

HTML中因为只涉及到表现层,所以只有一个属性content中charset,这个编码格式设置对了,就没问题了。

3. request中文乱码

有时候在做jsp逻辑处理时,比如提交表单,从前台注册的页面提交了一部分的数据,但是后面处理的JSP页面,通过 request.getParameter 调用时,获取到的是一堆乱码。

这是因为虽然前面JSP设置了编码格式,却没有在当前的JSP中设置读取数据的编码格式。

使用下面的代码,就可以是设置request获取请求内容的数据编码:

  1. request.setCharacterEncoding("UTF-8");

需要注意的是,这种方式对 URL传参这种JSP请求 是没有作用的。比如:

  1. <a href="jspRequest.jsp?username=lisi">url test request(en)</a>
  2. <a href="jspRequest.jsp?username=李四">url test request(zh)</a>

这种情况仍然会出现乱码,这种URL传参的方式,只能修改服务器tomcat的传输编码格式。

修改tomcat安装文件 apache-tomcat-6.0.43\conf 目录下的server.xml

format_png 2

添加 URIEncoding=”UTF-8” ,就可以处理URL传递参数造成的中文乱码问题了。

4. response输出中文乱码

可能现在已经没有多少使用这种方式输出页面的了,但是还是有必要说一下,response输出页面元素内容时,也会出现乱码。

使用下面代码就可以设置response输出的编码格式:

  1. response.setContentType("text/html;charset=UTF-8");

5. cookie造成的中文乱码

Cookie由于需要保存在客户端中,因此使用过程中都需要编码以及转码:

在保存Cookie数据前

  首先引入java.net.*,该包中包含URLEncoder类;

  保证response与request的编码正确;

  使用URLEncoder进行转码,并保存。

  1. <%@ page language="java" contentType="text/html; charset=UTF-8"
  2. import="java.net.*"
  3. pageEncoding="UTF-8"%>
  4. <%
  5. //保证request以及response的编码
  6. request.setCharacterEncoding("UTF-8");
  7. response.setContentType("text/html;charset=UTF-8");
  8. //使用URLEncoder解决cookie中中文问题
  9. String username = URLEncoder.encode(request.getParameter("username"),"UTF-8");
  10. String password = URLEncoder.encode(request.getParameter("password"),"UTF-8");
  11. Cookie usernameCookie = new Cookie("username",username);
  12. Cookie passwordCookie = new Cookie("password",password);
  13. usernameCookie.setMaxAge(864000);
  14. passwordCookie.setMaxAge(864000);
  15. response.addCookie(usernameCookie);
  16. response.addCookie(passwordCookie);
  17. %>

在使用Cookie数据前

  依然要注意导入必备的包:java.net.*

  注意request的编码;

  使用URLDecoder进行解码

  1. <%@ page language="java" import="java.util.*,java.io.*,java.net.*" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"
  2. %>
  3. <%
  4. request.setCharacterEncoding("UTF-8");
  5. String username = "";
  6. String password = "";
  7. Cookie[] cookies = request.getCookies();
  8. if(cookies!=null && cookies.length>0){
  9. for(Cookie c:cookies){
  10. if(c.getName().equals("username")){
  11. username = URLDecoder.decode(c.getValue(),"UTF-8");
  12. System.out.println(username);
  13. }
  14. if(c.getName().equals("password")){
  15. password = URLDecoder.decode(c.getValue(),"UTF-8");
  16. }
  17. }
  18. }
  19. %>

有时候还可能出现以下乱码现象:

1. URL传递参数中文乱码

  1. <%@ page language="java" import="java.util.*" pageEncoding="gb2312"%>
  2. <html>
  3. <head>
  4. <title>URL传递参数中英文处理示例</title>
  5. </head>
  6. <%
  7. String param = request.getParameter("param");
  8. %>
  9. <body>
  10. <a href="URLCharset.jsp?param='中文'">请单击这个链接</a>
  11. 您提交的这个参数为:<%=param %>
  12. </body>
  13. </html>

启动tomcat运行结果出现url传递的中文乱码:

20131007154939546

这里我们需要配置tomcat服务器文件,才能解决这个问题。具体方法是,在tomcat的conf目录下找到server.xml配置文件,找到如下代码

  1. <span style="font-size:18px"> <Connector port="8080" protocol="HTTP/1.1"
  2. connectionTimeout="20000"
  3. redirectPort="8443" /></span>

在后面添加上编码方式,URIEncoding=”gb2312” 重新启动tomcat问题就解决了。

2, 表单提交中问乱码

对于表单中提交的数据,可以用request.getPraramter(“”);方法来获取,但是当表单中出现中文数据的时候就会出现乱码。

我们的提交表单的页面,FormCharset.jsp页面如下:

  1. <%@ page language="java" contentType="text/html; charset=GB18030"
  2. pageEncoding="GB18030"%>
  3. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
  4. <html>
  5. <head>
  6. <meta http-equiv="Content-Type" content="text/html; charset=GB18030">
  7. <title>Form中文处理示例</title>
  8. </head>
  9. <body>
  10. 下面是表单内容:
  11. <form action="AcceptFormCharset.jsp" method="post">
  12. 用户名:<input type="text" name="userName" size="10" />
  13. 密 码:<input type="password" name="password" size="10"/>
  14. <input type="submit" value="提交"/>
  15. </form>
  16. </body>
  17. </html>

我们的AcceptFormCharset.jsp页面:

  1. <%@ page language="java" contentType="text/html; charset=GB18030"
  2. pageEncoding="GB18030"%>
  3. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
  4. <html>
  5. <head>
  6. <meta http-equiv="Content-Type" content="text/html; charset=GB18030">
  7. <title>Form中文处理示例</title>
  8. </head>
  9. <body>
  10. 下面是表单提交以后request取到的表单的数据:<br>
  11. <%
  12. out.println("表单输入的userName值为:" + request.getParameter("userName") +"<br>");
  13. out.println("表单输入的pasword值为:" +request.getParameter("password") + "<br>");
  14. %>
  15. </body>
  16. </html>

提交表单:

20131007160711875

结果如下:

20131007160739421

在表单中的中文数据出现了乱码,为什么楚翔这种情况呢?是因为我们的tomcat中,对于以post方式提交的表单编码格式默认为ISO-8859-1的编码格式,而这种编码格式是不能编码中文的,所以就会出现乱码的现象了。对于这种情况,我们可以对表单中的数据进行处理,在取得表单参数的时候设置编码方式,我们更改了我们的接受表单数据的页面如下所示:

  1. <%
  2. String userName = request.getParameter("userName");
  3. String passWord = request.getParameter("password");
  4. out.println("表单输入的userName值为:" + new String(userName.getBytes("ISO-8859-1"),"gb2312")+"<br>");
  5. out.println("表单输入的pasword值为:" + new String(passWord.getBytes("ISO-8859-1"),"gb2312")+"<br>");
  6. %>

这样就得到我们想要的效果啦:

20131007161812203

3. 数据库操作中文乱码

我们在建立数据库的时候,最好是能选择支持中文编码格式,最好是能和jsp页面编码格式保持一致,这样就尽可能的减少数据库操作中文乱码的问题,最开始的连接数据库的时候,编写好数据库的编码策略,也就是使用这种形式的URL:jdbc:Oracle:thin:@localhost:1521:TEST;userEnicode=true;characterEncoding=gb2312; 这样我们选择的数据库的编码和我们的jsp编码就一致了。

写入到数据库的时候,数据库中中文乱码:

但是如果我们在最开始的时候没有对数据库的编码进行设置,并且我们的数据库中已经有大量的数据的话,我们再向数据库中写入中文数据,数据库中的中文显示为乱码。在写入数据的时候出现乱码,是因为我们在处理表单的时候没有对字符的编码设置,对于这种情况,我们在jsp中或servlet中加入:

  1. rquest.setCharacterEncoding("gb2312");//处理表单请求的时候设置编码。

这样再看我们的数据库,插入的中文字段就不会乱码了。

从数据库中读出中文乱码:

数据库中的中文出现乱码,就是在读取数据库的时候进行转码,这样显示就不会乱码了。我们整理这样的一个转码函数:

  1. public String encoder(String str) throws UnsupportedEncodingException
  2. {
  3. String result = new String(str.getBytes("ISO-ISO-8859-1)"),"gb2312");
  4. }

4. Filter批量设置编码格式

对于每一个jsp或servlet我们都要设置编码格式,效率有些低,我们的servlet的Filter解决了我们的问题。

需要强调的一点,开始使用java model1模型的时候,我们在web.xml中配置只需要配置好jsp页面就可以了,在model2模型中我们使用servlet作为控制器,我们就需要在Filter的配置文件web.xml中配置好servlet的设置,对所有的servlet处理的表单编码进行设置。

  1. <filter>
  2. <filter-name>CharsetEncodingFilter</filter-name>
  3. <filter-class>com.bjpowernode.drp.util.filter.CharsetEncodingFilter</filter-class>
  4. <init-param>
  5. <param-name>encoding</param-name>
  6. <param-value>GBK</param-value>
  7. </init-param>
  8. </filter>
  9. <filter-mapping>
  10. <filter-name>CharsetEncodingFilter</filter-name>
  11. <url-pattern>*.jsp</url-pattern>
  12. </filter-mapping>
  13. <filter-mapping>
  14. <filter-name>CharsetEncodingFilter</filter-name>
  15. <url-pattern>/servlet/*</url-pattern>
  16. </filter-mapping>

面试相关:
















































2021年JAVA 精心整理的常见面试题-附详细答案【持续更新~~】

https://mikejun.blog.csdn.net/article/details/114488339

精心整理的计算机各类别的电子书籍【超全】

https://mikejun.blog.csdn.net/article/details/115442555

2021年- 精心整理的 SpringMVC 常见面试题-【附详细答案】

https://mikejun.blog.csdn.net/article/details/114992529

2021年- 精心整理的 SpringBoot 常见面试题-【附详细答案】

https://mikejun.blog.csdn.net/article/details/115682106

2021年SpringCloud 精选大厂面试题-【附详细答案】

https://mikejun.blog.csdn.net/article/details/116103358

2021年JAVA 面试题之—数据结构篇【附详细答案】

https://mikejun.blog.csdn.net/article/details/114647742

Java 多线程、多进程、并发编程面试总结 (2021年)

https://mikejun.blog.csdn.net/article/details/115830507
   

三天刷完《剑指OFFER编程题》—Java版本实现(第一天)

https://mikejun.blog.csdn.net/article/details/106996017

三天刷完《剑指OFFER编程题》—Java版本实现(第二天)

https://mikejun.blog.csdn.net/article/details/108098502

三天刷完《剑指OFFER编程题》—Java版本实现(第三天)

https://mikejun.blog.csdn.net/article/details/108253489

项目推荐:

2000多G的计算机各行业电子资源分享(持续更新)

2020年微信小程序全栈项目之喵喵交友【附课件和源码】

Spring Boot开发小而美的个人博客【附课件和源码】

Java微服务实战296集大型视频-谷粒商城【附代码和课件】

Java开发微服务畅购商城实战【全357集大项目】-附代码和课件

最全最详细数据结构与算法视频-【附课件和源码】

在这里插入图片描述


发表评论

表情:
评论列表 (有 0 条评论,308人围观)

还没有评论,来说两句吧...

相关阅读

    相关 weka中文解决办法

    由于weka的默认字符集编码是Cp1252,所以如果你导入的数据中有中文字符,就会出现乱码的情况,所以需要weka的RunWeka.ini文件 将cp1252替换成你的数据对

    相关 JSP解决中文问题

    一、JSP页面显示乱码 二、表单提交中文时出现乱码 三、数据库连接 大家在JSP的开发过程中,经常出现中文乱码的问题,可能一至困扰着您,我现在把我在JSP开发