javascriptで日本語文字の種類(漢字・ひらがな・カタカナ)を判別するためのメモ
(※) PDFは重いものもあるので注意
漢字
- CJK統合漢字:http://www.unicode.org/charts/PDF/U4E00.pdf
- CJK統合漢字拡張A:http://www.unicode.org/charts/PDF/U3400.pdf
- CJK統合漢字拡張B:http://www.unicode.org/charts/PDF/U20000.pdf
- CJK互換漢字:http://www.unicode.org/charts/PDF/UF900.pdf
- CJK互換漢字補助:http://www.unicode.org/charts/PDF/U2F800.pdf
function isKanji(c){ // c:判別したい文字 var unicode = c.charCodeAt(0); if ( (unicode>=0x4e00 && unicode<=0x9fcf) || // CJK統合漢字 (unicode>=0x3400 && unicode<=0x4dbf) || // CJK統合漢字拡張A (unicode>=0x20000 && unicode<=0x2a6df) || // CJK統合漢字拡張B (unicode>=0xf900 && unicode<=0xfadf) || // CJK互換漢字 (unicode>=0x2f800 && unicode<=0x2fa1f) ) // CJK互換漢字補助 return true; return false; }
漢文用の記号も必要なら入れる:http://www.unicode.org/charts/PDF/U3190.pdf
unicode>=0x3190 && unicode<=0x319f
ひらがな
function isHiragana(c){ var unicode = c.charCodeAt(0); if ( unicode>=0x3040 && unicode<=0x309f ) return true; return false; }
カタカナ
function isKatakana(c){ var unicode = c.charCodeAt(0); if ( unicode>=0x30a0 && unicode<=0x30ff ) return true; return false; }
半角カナ
function isHankakuKana(c){ var unicode = c.charCodeAt(0); if ( unicode>=0xff61 && unicode<=0xff9f ) return true; return false; }