IMEのクラウド利用には2つのタイプがある

中華人民共和国のインターネット検索サービスである百度(バイドゥ)のIME(入力メソッド)が、ユーザの入力内容をすべてバイドゥのサーバに送信していたということが話題になっていますね。26日朝のNHK「おはよう日本」でも、同様のことを日本のジャストシステムなども行っていると報道していました。

常日頃、大手メディア記者のITリテラシーはあまり高くないなと感じていましたが(日経新聞の内蔵メモリサイズ問題とか)、この報道も正確でなく誤解を招きますね。

Atok_sync_01

私はジャストシステムのATOKユーザなので、少しは弁護したいと思います。まず、ATOKではATOK Syncという仕組みで、ユーザ辞書をクラウド経由で共有し、端末間でユーザ辞書内容の均一化を図るということが行われています。

共有は、一定のタイミング(ユーザが指定可能)でユーザ辞書をクラウドサーバにアップロードし、既存の辞書とマージすることで最新のユーザ辞書をダウンロードするという仕組みです。これは、パソコンAで登録した単語が、パソコンBでも参照できることを意味します。

クラウドサーバは、ジャストスステムのInternetDiskというユーザ認証を通じて使用できるスペースですので、基本的に他のユーザが参照したりすることはできません。ただ、ユーザのデータをどう扱っているかというのはジャストシステム任せなので、ビッグデータとして処理されている可能性は十分にあります。

このへんは、利用許諾契約を十分に読みこなしていないのでわかりません。

バイドゥが行っているのは、ユーザの入力内容をそのまま無断でクラウドサーバに送りつけているというものです(とされています)。このへんの話は、Google IMEが登場した際にも話題になり、それによってGoogle IMEを使わないという人も出ていたようです。

この場合、辞書のクォリティキープというATOK Syncのコンセプトとはだいぶ異なり、検索キーワードと同様にビッグデータのためのソースとされていると見るのが妥当です(変換精度を上げるためだとも言われています)。

個別のユーザとの紐付けはないと見ているので、Aさんが入れたパスワードとか、そういったものがAさんと紐付けされる可能性はないと思いますが…。

言ってしまえば、クラウドというかASPが登場したとき、この手のリスクはすでにあったわけです。GmailをはじめとするWebメールなんか、メールデータそのものがユーザと紐付けされていますし、Googleにサインインした状態では検索キーワードその他の情報も筒抜けです。

インターネットに繋がっている、どこかのサービスにいつも繋がっているという状態では、情報のダダ漏れを完全に防ぐことなんてできませんし、意味がありません。

そうであれば、リスクをわかった上で付き合う、というのが正しい対処と言えましょう。性悪説に則れば何もできなくなるので、性善説に則るしかないわけですが…。

とりあえず、パスワードや口座番号などは、IMEをオフにして入力、カナ漢字変換が必要なときだけオンにする、というのが妥当でしょうかね。ついついサボって、半角固定モードや半角英数字モードで入れてしまうこともありますが…。

コメント