charset和URL编码关系

luolonghao

浏览: 118083 次
性别:
来自: Shanghai

最近访客更多访客>>

lgx2351

bukebuhao

su1216

andyz

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

JavaScript

encodeuricomponent

名词解释

charset： GBK、UTF-8、EUC-KR、Shift-JIS 等
URL编码：HTML form提交、JS里的encodeURIComponent函数

测试环境：

服务器：本地安装Apache，www根目录下放2个HTML页面（gbk.html和utf8.html），用Fiddler查看HTTP请求，或者tail -f access_log。

操作系统：Windows XP

浏览器版本：IE8、Firefox 10、Chrome 17、Opeara 11

form提交和encodeURIComponent的区别

form提交（application/x-www-form-urlencoded）：根据当前页面的charset进行URL编码。通过submit button提交，或者用form.submit()方法提交。在gbk.html页面【土豆】会变成【%CD%C1%B6%B9】，在utf8.html页面【土豆】会变成【%E5%9C%9F%E8%B1%86】。还有，form提交会把空格替换成加号（+），这个和RFC1738不一致，PHP里对应的函数是urlencode。
encodeURIComponent函数：不管页面的charset，都按UTF-8来处理，所以在gbk.html和utf8.html页面上执行encodeURIComponent("土豆")之后都得到【%E5%9C%9F%E8%B1%86】。encodeURIComponent完全符合RFC1738，会把空格替换成【%20】，PHP里对应的函数是rawurlencode。

浏览器地址栏行为

1. 打开encode后的URL：

GBK页面：

打开 http://localhost/gbk.html?kw=%CD%C1%B6%B9 ：

所有浏览器的地址栏直接显示 http://localhost/gbk.html?kw=%CD%C1%B6%B9。Opera比较特殊，默认隐藏GET参数部分，焦点移到地址栏时显示完整URL。

UTF-8页面：

打开 http://localhost/utf8.html?kw=%E5%9C%9F%E8%B1%86 ：

IE、Opera：直接显示URL，http://localhost/utf8.html?kw=%E5%9C%9F%E8%B1%86

Firefox、Chrome：把URL解码后显示， http://localhost/utf8.html?kw=土豆

2. 打开encode前的URL：

在浏览器地址栏直接输入带中文参数的URL按回车，有些浏览器会对中文进行URL编码，这个行为在不同浏览器不太一致。

打开 http://localhost/gbk.html?kw=土豆：

IE：无处理，发送 http://localhost/gbk.html?kw=土豆

Opera：URL编码， http://localhost/gbk.html?kw= %CD%C1%B6%B9

Firefox、Chrome：UTF8 + URL编码， http://localhost/gbk.html?kw=%E5%9C%9F%E8%B1%86

URL里带中文时需要看具体操作系统和浏览器，没有统一的标准。IE根据OS字符编码直接发送中文，Opera也是根据OS编码发送中文，只不过多一个URL编码处理。Firefox和Chrome一律按UTF-8字符处理，并进行URL编码。同事反映Firefox中文版是按OS编码发送中文，这个和Firefox本身的URL解码一起会导致BUG。

结论：

避免在URL出现中文，如果需求上要求用中文，请参考2和3。
如果不是ajax处理，并URL包含中文，一般是网站的搜索功能，这时GET请求最好以form方式提交，不要使用location.href之类的，这样可以始终保持一致的编码。
后端获取GET数据后加is_utf8判断，比如GBK项目的话，可以添加str = is_utf8(str) ? utf8_to_gbk(str) : str; 处理，用户直接把URL改成中文时也可以返回正确的结果。

参考文档：

分享到：

webdriver 自动化测试 | IE6重复加载图片BUG

2012-03-07 12:02
浏览 5164
评论(0)
论坛回复 / 浏览 (0 / 2277)
分类:Web前端
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论