也许你遇到过这样的问题,当我们用ASP从数据库中读取中文的时候出现乱码,我今天就遇到这种情况:
解决的办法是:
首先看你的代码中是否包含了这句代码 <" CODEPAGE="936"%> 简体中文 powered by 25175.net
其次看一下这句代码是不是出现在连接数据库代码之前,如果不是放在连接数据库代码的前面也可能会出错,一般建议放在最顶端,这样最保险。
另外我们要加的这句代码也可能是
<" CODEPAGE="650"%> 繁体中文
<" CODEPAGE="65001"%> UTF-8797000024
这取决你使用的编码,如果你使用的编码是utf-8
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
那么你就用 <" CODEPAGE="65001"%>
如果你是使用的gb2312
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
那么你就应该用 <" CODEPAGE="936"%>
具体要看你
ASP+Access UTF-8 网页乱码问题
用asp,access数据库,网页编码是utf-8。出现乱码,所有从数据库里读的中文字都是乱码。
问题解决:
<%@codepage="65001"%>powered by 25175.net
< http-equiv="Content-Type" content="text/html; charset=UTF-8">
一个也不能少
另外,文件要存为utf-8格式的
还有,程序不能出错,嘿嘿
要是有错误的程序,那么刚打开的时候正常的,刷新了就乱码了
这里说的出错时不会使整个页面不显示的出错。
1,<%@codepage="65001"%>
2,< http-equiv="Content-Type" content="text/html; charset=UTF-8">
3,Session.CodePage = 65001
4,文件存成 UTF-8
我来说说吧,这个我比较有经验,呵呵
2,< http-equiv="Content-Type" content="text/html; charset=UTF-8">
=======================================
这条比较重要,也比较常见,这个决定了浏览者浏览器选择哪一种内码来访问你的网页。
4,文件存成 UTF-8
如果你用中文输入法,网页里面出现中文,这一条就比较重要了.因为我们用普通输入法输入的文字不是UTF格式的,所以要重新保存成 UTF-8格式。
所有从数据库里读的中文字都是乱码
=====================
1,<%@codepage="65001"%>
出现这种事情,请加上这句话,其实数据库跟内码没什么关系,关键是ASP程序用什么内码去传输你的数据,加上这句话,就强制ASP用UTF来传输数据。
尝试在<%@codepage="65001"%>下加一行:
<%Session.CodePage=65001%>
一、操作系统
window系统内部都是unicode的。文件夹名,文件名等都是unicode的,任何语言系统下都能正常显示。
二、输入法:
微软拼音输出的是Unicode的,智能ABC输出是简体中文的(所以智能ABC在非简体中文系统根本不能用,只能打英文)。powered by 25175.net
三、网页的textarea
网页的textarea是用unicode显示的。所以往里打什么字都能显示。而一些flash做的输入框就不行了。
四、Access2000
access里面保存的数据是unicode的,在任何语言系统下都能显示。
如果数据视图查看有些字符不正常,那是因为显示所用的字体不是Unicode字体,
换用Arial Unicode MS 字体就能全部显示了。(access帮助,搜索,输入unicode,有说明)
五、Word
word里的繁简转换,简体转换到繁体后,内码仍是简体中文的,其实只是简体中的繁体字。
六、ASP内部是Unicode的,所有文本都是Unicode存储的。需要时转换到指定字符集。
=======================================================
首先说下结论:
<%@ codepage=936%>简体中文
<%@ codepage=950%>繁体中文
<%@ codepage=65001%>UTF-8
codepage指定了IIS按什么编码读取传递过来的串串(表单提交,地址栏传递等)。
也指定了所有文本变量从Unicode转换到的编码,
也就指定了从数据库取出的数据从Unicode转换到的编码。(注意这个,很重要。)
关键字:
读取:一个串串,按简体读取是一些字,按繁体读取是一些字,串串本身编码没有变。
转换:系统主动的转换,比如从Unicode的“化”字到Big5的“化”字,内码变成Big5的。如果Big5没有对应的字,保留Unicode形式(&#xxxx;)
简体中文:化六个结论
Unicode16进制形式:化六个结论
Unicode10进制形式:化六个结论
下面是我推测出来的编码转换的过程:
客户端:输入法Unicode--输入框unicode--从Unicode按charset转换到对应编码()--表单发送编码
服务器端:IIS解开表单编码--按codepage指定编码读取--转换到对应的Unicode--可以用request("")读取了--进行一些处理--以Unicode编码保存到数据库
服务器端:读取数据库的Unicode数据,转换到codepage指定编码---生成源代码--IE按charset读取显示。
下面举例说明:
例一:
假设有三个asp页面,典型的留言页面:
1. write.asp 简单的输入表单,提交到add.asp。
<META http-equiv="Content-Type" content="text/html; charset=big5">
2. add.asp 接收留言,保存到数据库
<%@ codepage=936%>
3. read.asp 从数据库取得留言,显示。
<%@ codepage=936%> charset=GB2312 或
<%@ codepage=950%> charset=big5
大家可以猜一猜,我在write.asp里用微软拼音输入法输入“化六个讨论”。最后在read.asp里会显示什么样?
是不是晕了。让我们从头分析。
例二:
把例一的add.asp的<%@ codepage=936%>改为<%@ codepage=950%>,又会怎么样呢?
到这里发现了什么?
1.如果输入的文字和Charset对应的不同,一转换,就可能出现Unicode形式的字了。这里就是原因所在。以后整个过程都保留着。
2.Add.asp里codepage决定了保存到数据库的文字,用的是哪个语言对应的Unicode.如codepage=936,
那么数据库保存的就是简体中文的Unicode(数据库拿回简体中文系统,一切正常的),
codepage=950保存的就是繁体中文的Unicode.(拿回简体中文系统,就不对了)。
3.注意一下串串的变化过程:
--------------------------------------------------------------------
1) 输入法---Charset Unicode----指定字符集的映射
2) Charset----表单编码 串串简单编码
3) 表单解码 上步的逆过程,两步抵消了。
4) 串串à按codepage读取 串串没变,这步有可能“误会读取”
5) 转为对应的Unicode Codepage指定字符集----Unicode映射
6) 中间处理,进数据库 无变化,直接以Unicode形式进入
8) 按codepage读取数据库 Unicode----codepage指定字符集的映射
9) 显示,按Charset指定字符集读取 串串没变。
-------------------------------------------------------------------------------
以例一说明:
797000024
例2
797000024
晕了。现在来用用知识。
797000024
案例1。
简体中文系统下跑的好好的代码,放到国外空间上,数据库里乱码,原有的数据也乱码。
分析:因为大多数人平时用的都是简体中文系统,默认的codepage=936,所以平时大家不写也没有关系。
但到了国外空间问题就出来了。从数据库里的Unicode转换到英文编码去了,所以数据库原有的简体中文转换到英文后,按GB显示自然乱码。
如图,新输入的文字显示正常,但数据库里保存的是英文的Unicode的。
解决方法:全部加上<%@codepage=936即可%>。
全程只有简体中文与对应Unicode间的转换。
转自:http://hi.baidu.com/emmar/blog/item/db21fe50859807511138c203.html