日本語が文字化け
とても便利なSpring Boot。改修予算がなくてオワコンのstrutsを使い続けなければならないプロジェクトが続いていたので、ようやくまともな世界に移れた!と思ったら、まさかの文字化け問題 orz
デフォルトは化けない
Spring Bootの名誉のために言っておくと、普通の使い方であれば、まず化けないだろう。GETパラメータやPOSTデータに含まれる日本語の文字コードは、多くの場合、UTF-8であると言い切っていい時代だ。Spring Bootのdefaultも、UTF-8のデータをうまくdecodeするようになっている。
UTF-8じゃないパラメータを扱う
UTF-8ではないパラメータをUTF-8としてdecodeすると、当然おかしなことになって、文字化けしたデータになってしまう。
- データを一旦バイナリに戻し
- 改めて文字コードを指定してdecodeする
new String(brokenData.getBytes("iso-8859-1"), 正しい文字コード);
でOK。のはずだが、これ、最初のdecodeがiso-8859-1で行われることを想定している。だから、最初にUTF-8でdecodeされてしまった場合、これではうまくいかないのだ。
Spring BootでISO-8859-1でdecodeさせる
TomcatとJettyを選べるのだが、defaultのTomcatの場合。NetBeansでいうところのその他のソース/src/main/resources/<デフォルト・パッケージ>/application.properties
に
と書く。書かなかった場合のdefaultの文字コードは、最近はUTF-8。昔は違ったようなので、これを書かなくてもうまくいくかもしれないが、バージョンアップしたときのことを考えると、書いておくべきだろう。server.tomcat.uri-encoding=ISO-8859-1