你知道如何提升JSON.stringify()的性能嗎?
點(diǎn)擊上方?前端Q,關(guān)注公眾號(hào)
回復(fù)加群,加入前端Q技術(shù)交流群
原文鏈接:?https://juejin.im/post/5cf61ed3e51d4555fd20a2f3
作者: AlienZHOU
1.熟悉的JSON.stringify
在瀏覽器端或服務(wù)端,JSON.stringify()都是我們很常用的方法:
將 JSON object 存儲(chǔ)到 localStorage 中; POST 請(qǐng)求中的 JSON body; 處理響應(yīng)體中的 JSON 形式的數(shù)據(jù); 甚至某些條件下,我們還會(huì)用它來實(shí)現(xiàn)一個(gè)簡單的深拷貝; ……
在一些性能敏感的場(chǎng)合下(例如服務(wù)端處理大量并發(fā)),或面對(duì)大量 stringify 的操作時(shí),我們會(huì)希望它的性能更好,速度更快。這也催生了一些優(yōu)化的 stringify 方案/庫,下圖是它們與原生方法的性能對(duì)比:

綠色部分是原生JSON.stringify(),可見性能相較這些庫都要低很多。那么,在大幅的性能提升背后的技術(shù)原理是什么呢?
2. 比 stringify 更快的 stringify
由于 JavaScript 是動(dòng)態(tài)性很強(qiáng)的語言,所以對(duì)于一個(gè) Object 類型的變量,其包含的鍵名、鍵值、鍵值類型最終只能在運(yùn)行時(shí)確定。因此,執(zhí)行JSON.stringify()時(shí)會(huì)有很多工作要做。在一無所知的情況下,我們想要大幅優(yōu)化顯然無能為力。
那么如果我們知道這個(gè) Object 中的鍵名、鍵值信息呢 —— 也就是知道它的結(jié)構(gòu)信息,這會(huì)有幫助么?
看個(gè)例子:
下面這個(gè) Object,
const?obj?=?{
????name:?'alienzhou',
????status:?6,
????working:?true
};
我們對(duì)它應(yīng)用JSON.stringify(),得到結(jié)果為
JSON.stringify(obj);
//?{"name":"alienzhou","status":6,"working":true}
現(xiàn)在如果我們知道這個(gè)obj的結(jié)構(gòu)是固定的:
鍵名不變 鍵值的類型一定
那么其實(shí),我可以創(chuàng)建一個(gè)“定制化”的 stringify 方法
function?myStringify(o)?{
????return?(
????????'{"name":"'
????????+?o.name
????????+?'","status":'
????????+?o.status
????????+?',"isWorking":'
????????+?o.working
????????+?'}'
????);
}
看看我們的myStringify方法的輸出:
myStringify({
name: 'alienzhou',
status: 6,
working: true
});
// {"name":"alienzhou","status":6,"isWorking":true}
myStringify({
name: 'mengshou',
status: 3,
working: false
});
// {"name":"mengshou","status":3,"isWorking":false}
可以得到正確的結(jié)果,但只用到了類型轉(zhuǎn)換和字符串拼接,所以“定制化”方法可以讓“stringify”更快。
總結(jié)來看,如何得到比 stringify 更快的 stringify 方法呢?
需要先確定對(duì)象的結(jié)構(gòu)信息; 根據(jù)其結(jié)構(gòu)信息,為該種結(jié)構(gòu)的對(duì)象創(chuàng)建“定制化”的 stringify方法,其內(nèi)部實(shí)際是通過字符串拼接生成結(jié)果的;最后,使用該“定制化”的方法來 stringify 對(duì)象即可。
這也是大多數(shù) stringify 加速庫的套路,轉(zhuǎn)化為代碼就是類似:
import?faster?from?'some_library_faster_stringify';
//?1.?通過相應(yīng)規(guī)則,定義你的對(duì)象結(jié)構(gòu)
const?theObjectScheme?=?{
????//?……
};
//?2.?根據(jù)結(jié)構(gòu),得到一個(gè)定制化的方法
const?stringify?=?faster(theObjectScheme);
//?3.?調(diào)用方法,快速?stringify
const?target?=?{
????//?……
};
stringify(target);
3. 如何生成“定制化”的方法
根據(jù)上面的分析,核心功能在于,根據(jù)其結(jié)構(gòu)信息,為該類對(duì)象創(chuàng)建“定制化”的stringify方法,其內(nèi)部實(shí)際是簡單的屬性訪問與字符串拼接。
為了了解具體的實(shí)現(xiàn)方式,下面我以兩個(gè)實(shí)現(xiàn)上略有差異的開源庫為例來簡單介紹一下。
3.1. fast-json-stringify

下圖是根據(jù) fast-json-stringify[1] 提供的 benchmark 結(jié)果,整理出來的性能對(duì)比。

可以看到,在大多數(shù)場(chǎng)景下具備2-5倍的性能提升。
3.1.1. scheme 的定義方式
fast-json-stringify 使用了 JSON Schema Validation[2] 來定義(JSON)對(duì)象的數(shù)據(jù)格式。其 scheme 定義的結(jié)構(gòu)本身也是 JSON 格式的,例如對(duì)象
{
????name:?'alienzhou',
????status:?6,
????working:?true
}
對(duì)應(yīng)的 scheme 就是:
{
????title:?'Example?Schema',
????type:?'object',
????properties:?{
????????name:?{
????????????type:?'string'
????????},
????????status:?{
????????????type:?'integer'
????????},
????????working:?{
????????????type:?'boolean'
????????}
????}
}
其 scheme 定義規(guī)則豐富,具體使用可以參考 Ajv[3] 這個(gè) JSON 校驗(yàn)庫。
3.1.2. stringify 方法的生成
fast-json-stringify 會(huì)根據(jù)剛才定義的 scheme,拼接生成出實(shí)際的函數(shù)代碼字符串,然后使用 Function 構(gòu)造函數(shù)[4]在運(yùn)行時(shí)動(dòng)態(tài)生成對(duì)應(yīng)的 stringify 函數(shù)。
在代碼生成上,首先它會(huì)注入預(yù)先定義好的各類工具方法,這一部分不同的 scheme 都是一樣的:
var?code?=?`'use?strict'`
??code?+=?`
????${$asString.toString()}
????${$asStringNullable.toString()}
????${$asStringSmall.toString()}
????${$asNumber.toString()}
????${$asNumberNullable.toString()}
????${$asIntegerNullable.toString()}
????${$asNull.toString()}
????${$asBoolean.toString()}
????${$asBooleanNullable.toString()}
??`
其次,就會(huì)根據(jù) scheme 定義的具體內(nèi)容生成 stringify 函數(shù)的具體代碼。而生成的方式也比較簡單:通過遍歷 scheme。
遍歷 scheme 時(shí),根據(jù)定義的類型,在對(duì)應(yīng)代碼處插入相應(yīng)的工具函數(shù)用于鍵值轉(zhuǎn)換。例如上面例子中name這個(gè)屬性:
var?accessor?=?key.indexOf('[')?===?0???sanitizeKey(key)?:?`['${sanitizeKey(key)}']`
switch?(type)?{
????case?'null':
????????code?+=?`
????????????json?+=?$asNull()
????????`
????????break
????case?'string':
????????code?+=?nullable???`json?+=?obj${accessor}?===?null???null?:?$asString(obj${accessor})`?:?`json?+=?$asString(obj${accessor})`
????????break
????case?'integer':
????????code?+=?nullable???`json?+=?obj${accessor}?===?null???null?:?$asInteger(obj${accessor})`?:?`json?+=?$asInteger(obj${accessor})`
????????break
????……
上面代碼中的code變量保存的就是最后生成的函數(shù)體的代碼串。由于在 scheme 定義中,name為string類型,且不為空,所以會(huì)在code中添加如下一段代碼字符串:
"json?+=?$asString(obj['name'])"
由于還需要處理數(shù)組、級(jí)聯(lián)對(duì)象等復(fù)雜情況,實(shí)際的代碼省略了很多。
然后,生成的完整的code字符串大致如下:
function?$asString(str)?{
????//?……
}
function?$asStringNullable(str)?{
????//?……
}
function?$asStringSmall(str)?{
????//?……
}
function?$asNumber(i)?{
????//?……
}
function?$asNumberNullable(i)?{
????//?……
}
/*?以上是一系列通用的鍵值轉(zhuǎn)換方法?*/
/*?$main?就是?stringify?的主體函數(shù)?*/
function?$main(input)?{
????var?obj?=?typeof?input.toJSON?===?'function'
??????????input.toJSON()
????????:?input
????var?json?=?'{'
????var?addComma?=?false
????if?(obj['name']?!==?undefined)?{
????????if?(addComma)?{
????????????json?+=?','
????????}
????????addComma?=?true
????????json?+=?'"name":'
????????json?+=?$asString(obj['name'])
????}
????//?……?其他屬性(status、working)的拼接
????json?+=?'}'
????return?json
}
return?$main
最后,將code字符串傳入 Function 構(gòu)造函數(shù)來創(chuàng)建相應(yīng)的 stringify 函數(shù)。
//?dependencies?主要用于處理包含?anyOf?與?if?語法的情況
dependenciesName.push(code)
return?(Function.apply(null,?dependenciesName).apply(null,?dependencies))
3.2. slow-json-stringify

slow-json-stringify[5] 雖然名字叫 "slow",但其實(shí)是一個(gè) "fast" 的 stringify 庫(命名很調(diào)皮)。
The slowest stringifier in the known universe. Just kidding, it's the fastest (:
它的實(shí)現(xiàn)比前面提到的 fast-json-stringify 更輕量級(jí),思路也很巧妙。同時(shí)它在很多場(chǎng)景下效率會(huì)比 fast-json-stringify 更快[6]。


3.2.1. scheme 的定義方式
slow-json-stringify 的 scheme 定義更自然與簡單,主要就是將鍵值替換為類型描述。還是上面這個(gè)對(duì)象的例子,scheme 會(huì)變?yōu)?/p>
{
????name:?'string',
????status:?'number',
????working:?'boolean'
}
確實(shí)非常直觀。
3.2.2. stringify 方法的生成
不知道你注意到?jīng)]有
//?scheme
{
????name:?'string',
????status:?'number',
????working:?'boolean'
}
//?目標(biāo)對(duì)象
{
????name:?'alienzhou',
????status:?6,
????working:?true
}
scheme 和原對(duì)象的結(jié)構(gòu)是不是很像?
這種 scheme 的巧妙之處在于,這樣定義之后,我們可以先把 scheme JSON.stringify一下,然后“扣去”所有類型值,最后等著我們的就是把實(shí)際的值直接填充到 scheme 對(duì)應(yīng)的類型聲明處。
具體如何操作呢?
首先,可以直接對(duì) scheme 調(diào)用JSON.stringify()來生成基礎(chǔ)模版,同時(shí)借用JSON.stringify()的第二個(gè)參數(shù)來作為遍歷方法收集屬性的訪問路徑:
let?map?=?{};
const?str?=?JSON.stringify(schema,?(prop,?value)?=>?{
????const?isArray?=?Array.isArray(value);
????if?(typeof?value?!==?'object'?||?isArray)?{
????????if?(isArray)?{
????????????const?current?=?value[0];
????????????arrais.set(prop,?current);
????????}
????????_validator(value);
????????map[prop]?=?_deepPath(schema,?prop);
????????props?+=?`"${prop}"|`;
????}
????return?value;
});
此時(shí),map 里收集所有屬性的訪問路徑。同時(shí)生成的props可以拼接為匹配相應(yīng)類型字符串的正則表達(dá)式,例如我們這個(gè)例子里的正則表達(dá)式為/"name"|"status"|"working"|"(string|number|boolean|undef)"|\\[(.*?)\\]/。
然后,根據(jù)正則表達(dá)式來順序匹配這些屬性,替換掉屬性類型的字符串,換成統(tǒng)一的占位字符串"__par__",并基于"__par__"拆分字符串:
const?queue?=?[];
const?chunks?=?str
????.replace(regex,?(type)?=>?{
??????switch?(type)?{
????????case?'"string"':
????????case?'"undefined"':
??????????return?'"__par__"';
????????case?'"number"':
????????case?'"boolean"':
????????case?'["array-simple"]':
????????case?'[null]':
??????????return?'__par__';
????????default:
??????????const?prop?=?type.match(/(?<=\").+?(?=\")/)[0];
??????????queue.push(prop);
??????????return?type;
??????}
????})
????.split('__par__');
這樣你就會(huì)得到chunks和props兩個(gè)數(shù)組。chunks里包含了被分割的 JSON 字符串。以例子來說,兩個(gè)數(shù)組分別如下
//?chunks
[
????'{"name":"',
????'","status":"',
????'","working":"',
????'"}'
]
//?props
[
????'name',
????'status',
????'working'
]
最后,由于 map 中保存了屬性名與訪問路徑的映射,因此可以根據(jù) prop 訪問到對(duì)象中某個(gè)屬性的值,循環(huán)遍歷數(shù)組,將其與對(duì)應(yīng)的 chunks 拼接即可。
從代碼量和實(shí)現(xiàn)方式來看,這個(gè)方案會(huì)更輕便與巧妙,同時(shí)也不需要通過 Function、eval 等方式動(dòng)態(tài)生成或執(zhí)行函數(shù)。
4. 總結(jié)
雖然不同庫的實(shí)現(xiàn)有差異,但從整體思路上來說,實(shí)現(xiàn)高性能 stringify 的方式都是一樣的:
開發(fā)者定義 Object 的 JSON scheme; stringify 庫根據(jù) scheme 生成對(duì)應(yīng)的模版方法,模版方法里會(huì)對(duì)屬性與值進(jìn)行字符串拼接(顯然,屬性訪問與字符串拼接的效率要高多了); 最后開發(fā)者調(diào)用返回的方法來 stringify Object 即可。
歸根到底,它本質(zhì)上是通過靜態(tài)的結(jié)構(gòu)信息將優(yōu)化與分析前置了。
Tips
最后,還是想提一下
所有的 benchmark 只能作為一個(gè)參考,具體是否有性能提升、提升多少還是建議你在實(shí)際的業(yè)務(wù)中測(cè)試; fast-json-stringify 中使用到了 Function 構(gòu)造函數(shù),因此建議不要將用戶輸入直接用作 scheme,以防一些安全問題。

往期推薦



最后
歡迎加我微信,拉你進(jìn)技術(shù)群,長期交流學(xué)習(xí)...
歡迎關(guān)注「前端Q」,認(rèn)真學(xué)前端,做個(gè)專業(yè)的技術(shù)人...


