游乐游手机版
首页/前端开发/文章详情

前端实现字符串GBK与GB2312的编解码(小结)

时间:2026-04-27 20:24
前言 在项目开发中,有时会遇到一些看似简单却颇为棘手的细节问题。比如这次,产品需求是从浏览器地址栏准确获取用户的搜索关键词。听起来很基础对不对?但坑就埋在这里:我们项目通常使用UTF-8编码,而主流搜索引擎如百度和谷歌,在对搜索词进行编码时,默认采用的却是GBK或GB2312编码。编码格式一错位,解

前言

在项目开发中,有时会遇到一些看似简单却颇为棘手的细节问题。比如这次,产品需求是从浏览器地址栏准确获取用户的搜索关键词。听起来很基础对不对?但坑就埋在这里:我们项目通常使用UTF-8编码,而主流搜索引擎如百度和谷歌,在对搜索词进行编码时,默认采用的却是GBK或GB2312编码。编码格式一错位,解码自然就乱套了,显示一堆乱码。

为了解决这个跨编码的难题,当时在网上进行了一番搜寻,最终找到了一位技术前辈分享的巧妙方案——利用iframe来实现GBK/GB2312与UTF-8之间的编码转换。这个方法非常实用,为了避免自己日后遗忘,也希望能给遇到同样问题的朋友指个路,特此将核心思路和代码整理出来。文末也会附上参考的文章链接,以供深入查阅。

1、编码(支持GBK和GB2312)

其核心思路是,通过动态创建表单(form)并指定其accept-charset属性为目标编码(如GBK),然后提交到一个隐藏的iframe中。这样一来,iframe页面接收到的查询字符串,就已经被浏览器按照指定编码重新编码过了。

为了流程干净,我们可以把表单的提交目标设为当前页面本身,并把回调函数放在页面JS的最前面。这样,当这个页面作为iframe子窗口加载时,就能立刻执行父窗口预设的回调函数,然后自动关闭自己,整个过程对用户无感。

if (parent.__encode__iframe__callback__) { // 判断当前页面是否为子窗口
    parent.__encode__iframe__callback__(location.search.split('=')[1]);
    //直接关闭当前子窗口
    window.close();
}

function GBKEncode(str, charset, callback) {
    //创建form通过accept-charset做encode
    var form = document.createElement('form');
    form.method = 'get';
    form.style.display = 'none';
    form.acceptCharset = charset;

    if (document.all) {
        //如果是IE那么就调用document.charset方法
        window.oldCharset = document.charset;
        document.charset = charset;
    }

    var input = document.createElement('input');
    input.type = 'hidden';
    input.name = 'str';
    input.value = str;
    form.appendChild(input);
    form.target = '__encode__iframe__'; // 指定提交的目标的iframe
    document.body.appendChild(form);

    //隐藏iframe截获提交的字符串
    if (!window['__encode__iframe__']) {
        var iframe;
        iframe = document.createElement('iframe');
        iframe.setAttribute('name', '__encode__iframe__');
        iframe.style.display = 'none';
        iframe.width = "0";
        iframe.height = "0";
        iframe.scrolling = "no";
        iframe.allowtransparency = "true";
        iframe.frameborder = "0";
        iframe.src = 'about:blank'; // 设置为空白
        document.body.appendChild(iframe);
    }

    window.__encode__iframe__callback__ = function (str) {
        callback(str);
        if (document.all) {
            document.charset = window.oldCharset;
        }
    }

    //设置回调编码页面的地址,这里需要用户修改
    form.action = window.location.href;
    form.submit();

    setTimeout(function () {
        form.parentNode.removeChild(form);
        iframe.parentNode.removeChild(iframe);
    }, 1000) // 0.5秒后移除节点
}

GBKEncode('需要编码的字符', 'gb2312', callback);// 测试

// promise封装
var encode = function encode(str) {
    var charset = arguments.length > 1 && arguments[1] !== undefined ? arguments[1] : 'gbk';
    return new Promise(function (resolve, reject) {
        try {
            _encode(str, charset, function (data) {
                resolve(data);
            });
        } catch (e) {
            resolve('字符编码错误.', e.toString());
        }
    });
};

二、解码(支持GBK、GB2312、Base64)

解码端的思路同样巧妙,它利用了data:协议和动态脚本执行。通过创建一个script标签,将其src指向一个指定了字符集的data:text/ja vascript URL,并在URL中直接执行回调函数,从而让浏览器自动完成解码工作。

function randomId() {
    var text = "";
    var possible = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789";
    for (var i = 0; i < 5; i++) {
        text += possible.charAt(Math.floor(Math.random() * possible.length));
    }
return text;
}

function _decode(str, charset, callback) {
    var script = document.createElement('script');
    var id = randomId(); // 生成唯一ID,防止冲突
    script.id = '_urlDecodeFn_' + id;
    window['_urlDecodeFn_' + id] = callback;

    var src = 'data:text/ja vascript;charset=' + charset + (',_urlDecodeFn_' + id + '("') + str + '");';
    src += 'document.getElementById("_urlDecodeFn_' + id + '").parentNode.removeChild(document.getElementById("_urlDecodeFn_' + id + '"));';
    script.src = src;
    document.body.appendChild(script);
}

_decode('需要解码的字符', 'gb2312', callback) // 测试

// promise封装
var decode = function decode(str) {
    var charset = arguments.length > 1 && arguments[1] !== undefined ? arguments[1] : 'gbk';
    return new Promise(function (resolve, reject) {
        try {
            _decode(str, charset, function (data) {
                resolve(data);
            });
        } catch (e) {
            resolve('字符解码错误.', e.toString());
        }
    });
};

参考链接:https://zhuanlan.zhihu.com/p/35537480

来源:https://www.jb51.net/web/754749.html
上一篇网页宽度自动适应手机屏幕宽度的实现代码(viewport) 下一篇HTML倒计时依赖时间控制吗_HTML倒计时对时间控制影响【科普】
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Vue应用中异步更新性能问题的优化策略详解
前端开发 · 2026-07-03

Vue应用中异步更新性能问题的优化策略详解

先来看一个令许多开发者感到困惑的场景:明明修改了数据,DOM 却“毫无反应”,无法获取最新的高度,也无法计算正确的坐标。这并非 Vue 的缺陷,反而是它精心设计的性能优化策略。核心在于——你需要学会与它“异步更新”的特性协作,而非硬碰硬。 所谓的“异步更新性能问题”,本质上是一种认知偏差。Vue 的

如何避免原型对象挂载大体积动态数组内存污染
前端开发 · 2026-07-03

如何避免原型对象挂载大体积动态数组内存污染

原型链上的大数组:一个隐蔽的内存冲击波 先给个核心判断:直接在原型对象上挂载一个大体积动态数组,这既不是传统意义上的内存“污染”,也不是安全漏洞那种“污染”,而是一种相当隐蔽但后果严重的内存管理失当。它会导致所有实例共享同一份数据,而且正因为生命周期跟整个原型链绑定得太紧,垃圾回收器(GC)根本看不

利用堆栈信息精准定位显式绑定错误对象致未定义异常
前端开发 · 2026-07-03

利用堆栈信息精准定位显式绑定错误对象致未定义异常

深入追踪:显式绑定传错对象引发的未定义异常 说实话,这类问题在JavaScript开发中相当常见——显式绑定传错了对象,然后方法执行时静默失败、访问undefined、或者抛出TypeError。但真正的难点不在于“报了什么错”,而在于“到底是哪个对象被绑错了”。要解决它,需要跳出堆栈的表层报错信息

ES模块中默认导出和具名导出的执行上下文
前端开发 · 2026-07-03

ES模块中默认导出和具名导出的执行上下文

export default 与具名导出在 ES Module 中的行为机制截然不同,核心差异不在于“值如何传递”,而在于绑定如何建立以及导入时如何使用。先给出总结性结论,再逐一详细拆解。 export default 是一种语法糖,而非真正的变量声明 这种设计容易引起误解。实际上,export d

详解HTML中iframe标签loading=lazy属性实现嵌入内容懒加载方法
前端开发 · 2026-07-03

详解HTML中iframe标签loading=lazy属性实现嵌入内容懒加载方法

先聊聊 loading= "lazy " 这个属性——它本意是让 iframe 实现延迟加载,但实际落地时常常“失效”。这并非程序漏洞,而是浏览器内置的防御机制:只有所有条件同时触发,它才会真正推迟资源请求。比如 src 必须是跨域地址(类似 https: widget example com emb