2017/04/29

Spring Bootで日本語パラメータが文字化けする

日本語が文字化け

とても便利なSpring Boot。改修予算がなくてオワコンのstrutsを使い続けなければならないプロジェクトが続いていたので、ようやくまともな世界に移れた!と思ったら、まさかの文字化け問題 orz

デフォルトは化けない

Spring Bootの名誉のために言っておくと、普通の使い方であれば、まず化けないだろう。GETパラメータやPOSTデータに含まれる日本語の文字コードは、多くの場合、UTF-8であると言い切っていい時代だ。Spring Bootのdefaultも、UTF-8のデータをうまくdecodeするようになっている。

UTF-8じゃないパラメータを扱う

UTF-8ではないパラメータをUTF-8としてdecodeすると、当然おかしなことになって、文字化けしたデータになってしまう。

  • データを一旦バイナリに戻し
  • 改めて文字コードを指定してdecodeする
という手順を踏めば、正しいデータが得られる。
new String(brokenData.getBytes("iso-8859-1"), 正しい文字コード);
でOK。のはずだが、これ、最初のdecodeがiso-8859-1で行われることを想定している。だから、最初にUTF-8でdecodeされてしまった場合、これではうまくいかないのだ。

Spring BootでISO-8859-1でdecodeさせる

TomcatとJettyを選べるのだが、defaultのTomcatの場合。NetBeansでいうところのその他のソース/src/main/rexources/<デフォルト・パッケージ>/application.properties

server.tomcat.uri-encoding=ISO-8859-1
と書く。書かなかった場合のdefaultの文字コードは、最近はUTF-8。昔は違ったようなので、これを書かなくてもうまくいくかもしれないが、バージョンアップしたときのことを考えると、書いておくべきだろう。





0 件のコメント :

コメントを投稿

Comments on Google+: