tanamonの稀に良く書く日記

KEEP CALM AND DRINK BEER

2009-02-16から1日間の記事一覧

OracleをShift JISからUTF-8/UTF-16へ移行する時の問題点

今JA16SJISTILDE(Shift JIS)で運用しているDBをAL32UTF8(UTF-8)かAL16UTF16(UTF-16)に変更しようという話が出てきているので、何が問題になりそうかメモしてみる。 きっと他にもあるので後で追記する。 格納データ量が増える 1.5倍〜2倍程度には増える。 こ…

UTF-8/UTF-16/UTF-32の違い

軽く調べてみた。 UTF-8 1文字は1byte〜6byteで表される。 (6byteで31bitまでの表現ができる) ASCIIは1byte ISO 8859-1以外のISO 8859の8bit文字は2byte 大抵の日本語文字(半角カナ含む)は3byte 5〜6byteの文字は定義されていないし、する気もなさそう I…