求javascript 將input string 變做utf-8 hex string方法

如題
例如
陳大文變做E9 99 B3 E5 A4 A7 E6 96 87

呢個問題唔係冇google過
charCodeAt(x).toString(16) 就變左UTF-16

encodeURIComponent 就 唔convert 英文

有冇高人指點?

TOP

GOOGLE 左之後都有好多LIB / CODE可以抄...
用encodeURIComponent 自己另外HANDLE 頭128個又得
再唔係嘅話自己寫都唔太難...

但encodeURIComponent 呢啲好似只support plane 0
睇你有冇需要玩埋其他plane

TOP

TOP

搵錯方向,  原來係要抄CODE,  我之前以為javascript 有built-in function 好易做到
http://jonisalonen.com/2012/from-utf-16-to-utf-8-in-javascript/

重點部分一d都睇唔明

TOP

本帖最後由 masseffect 於 2016-4-9 17:18 編輯
搵錯方向,  原來係要抄CODE,  我之前以為javascript 有built-in function 好易做到


重點部分一d都睇唔明 ...
twaiho2003 發表於 2016-4-5 10:24



  要明嘅話你要知道咩係Unicode codepoint
咩叫UTF-8/UTF-16
其實就係將個codepoint encode 做UTF-8
唔同段嘅code-point 做法有啲唔同,啲code就用bitwise ops 去做

但你POST 嗰個好似係UTF-16 轉UTF-8嚟

EDIT: 睇返你POST 嗰條LINK
其實佢就係話JS 入面嘅STRING 係UTF-16嚟
但係一個字可以係16 BIT 又可以係32 BIT

個program第一part 係handle codepoint <0x800 嘅
係啲char 轉做utf8 係16bit

第三part 係handle UTF-16 入面啲32 BIT char
轉做UTF8 都會係32 BIT

第二PART係就HANDLE 轉做UTF-8 會變成24 BIT 嘅CHAR

TOP