誤変換の窓 
- Io videblas tra fenestro -

Last update on 2003.03.10

 こんにちは|こんばんは。鶸俣昇です。

 競合他者多数を承知の上で、「日本語入力システムたちが繰り広げる お茶目な『誤変換』」集でっす。

 掲載しても何もあげられませんけど(^^;)、 投稿は nulpleno@col.hi-ho.ne.jpまで、表題(Subject)に[誤変換の窓]と 書いて送ってください。投稿者の個人情報は厳重に保護します。 「でもやっぱ『ハンドル名』くらい載せたい」という人はその旨明記し てください。それから、著作権は放棄ということでお願いします。

 とうぜん、意図していない、予期していない「誤変換」のみ受けつけ ます。

表題にある「謎の文字列」の説明を読む
能書きを読む

2004年3月19日・読者投稿(あさいさん)・かきいさんのかきいさん

環境

入力値・期待値

かきいさん (柿井さん)

実績値

下記遺産

去年一緒に仕事をした柿井さんあてにメールを書いていたら出ました。 確かに書こうとしてはいたのですが(下に続く)

2004年3月19日・読者投稿(あさいさん)・囲うって何を加奈?

環境

入力値・期待値

かこうとしてはいたのだが  (書こうとしてはいたのだが)

実績値

囲うとして吐いたのだが

うーむ、娘を持つ親としては、囲うなどと言うと吐く羽目になると言う事??

(鶸俣昇)
娘の前で言っちゃいけませんよね。きっと。

2004年3月11日・読者投稿(さとーさん)・鋼鉄の胸

久々になかなかのものが。(さとーさん)

環境

入力値・期待値

てつだった (手伝った)

実績値

鉄だった

「テスト鉄だった時」っていったい (--;;;
そうか、鉄だったのか、通りで手強かったわけだ...

(鶸俣昇)
大受けしましたが、よく考えるとこれは厳密にはここで研究対象として いる「誤変換」ではないでしょうね。文節区切りなどに問題ないし…… でもめちゃくちゃ面白いので採用。

「彼があまりに大変そうだった時は、わたしが 鉄だった

「彼女が鉄だった っていうのに、みんな一体何していたんだ」

2004年2月27日・梅の季節

誤変換の同時性理論について研究を進める必要があると思う。

環境

入力値・期待値

うめがまんかい (梅が満開)

実績値

梅我慢かい

我慢しているらしい?

2004年2月24日・読者投稿(あさいさん)・揺られて眠れ

誤変換強化月間。

環境

入力値・期待値

すいませんでしたが (吸いませんでしたが)

実績値

睡魔船でしたが

確かに昼過ぎでは有りましたが・・・

(鶸俣昇)
bateaux ibresだと「酔いどれ船」なんですけどね。
睡魔が船でやってくる。ちょっと怖いかもですね。

2004年2月13日・読者投稿(こいけさん)・苦役と言いたかったんだろう

誤変換集中発生。

環境

入力値・期待値

CPUきりかえき (CPU切替器)

実績値

CPUきり課役

(鶸俣昇)
これは非常に珍しい「誤変換」かも。「課役」って辞書に載ってないみ たいだし。どこかで見かけた記憶はあるんですが。

2004年2月12日・読者投稿(さとーさん)・なんつーかある種のそれ

誤変換の法則(仕事を真面目にやってるといっぱい誤変換される)を 実感している今日このごろです。

環境

入力値・期待値

いっしゅうめ (一周目)

実績値

一種梅

一種って... 結局梅なのか、梅じゃないのか、 はっきりしろってんだ。まったく。もぅ。

(鶸俣昇)
これはバラ科サクラ属としてのウメそれ自体を指しているんじゃなくて、 びょーきの方なんじゃないでしょーか、びょーきの。え、げひんですか?  ふん、げひんで悪かったなちくしょーなんでーじょうひんぶりやがっ てよー。
もとい。梅界にも等級があるってことなんじゃないでショーか。 第一種梅技術者みたいに。

2004年2月12日・読者投稿(さとーさん)・ニューヨーク方面か、大阪方面か

環境

入力値・期待値

やんきーす (ヤンキース)

実績値

ヤンキー酢

ものすごーくすっぱいのか、気がぬけた感じのすっぱさなのかは微妙。

(鶸俣昇)
個人的には、剃りが入ってて眉がなくてキャバサン履いた酢のことなの ではないかと思いま酢。

2003年3月10日・何なのか教えてくれ

環境

入力値・期待値

しけんせいせきしょ (試験成績書)

実績値

試験生セ期初

試験・生セ・期初、と、文節を切りやがりました。やつは。えぇ。

「生セ」ってなに?

2003年3月08日・きっとおいしいんだろう それは

環境

入力値・期待値

かみのほうに (紙の方に)

実績値

上之保雲丹

しまった。これ、電子ファイルじゃなくて上之保雲丹書いてあるんだ。 上之保雲丹。あ?

いったいどんな雲丹なんだよ。

2003年2月20日・不両立

環境

入力値・期待値

しょきふりょうりつ (初期不良率)

実績値

初寄付両立

何考えてるんだ、おめーは。寄付と何が両立するんだ? 言ってみろ。

2003年2月18日・読者投稿(あさいさん)・一家揃って好きなんです

環境

入力値・期待値

おさけのしゅみ (お酒の趣味)

実績値

長家の趣味

(鶸俣昇)

MS-IMEの開発陣に長(おさ)さんという人がいたんです。きっと。

あさいさんと言えば、「朝遺産」と変換される例もありましたね、確か。

2003年2月6日・何が言いたい

環境

入力値・期待値

ないぶむけのめも (内部向けのメモ)

実績値

内部向飲めも

「飲めも」??

2003年1月30日・どっちかというと正反対なんじゃ……?

環境

入力値・期待値

みおとした (見落とした)

実績値

澪とした

慌てて国語辞典に当たった。ええ。「澪つくし」なんてドラマがあった 時も調べたことはありません(だいたい一度も見なかったし)。

「澪」:(海岸の近くで)船が安全に通れる水路。「水脈」とも。(新 明解国語辞典第五版)

……………………

2003年1月17日・90もねぇよ(たぶん)

環境

入力値・期待値

かいしゃくじっこう (解釈実行)

実績値

会社九十項

就業規則かなんかのことを言っているのだと思う(違うよ >自分)

それにしても、さいきんはインタープリターのことを「解釈実行系」と は言わないのですか。コンパイラは「翻訳系」とは言わないのですか。

2003年1月15日・微動だにしない

環境

入力値・期待値

あるかず (ある数)

実績値

歩かず

2002年11月29日・だいたい三頭とちょっとくらい、か

環境

入力値・期待値

くまがいさん (熊谷さん)

実績値

熊概算

熊が大雑把に見積もっている、ということなのかも知れない。蜂蜜の量 とか鮭の数とか。

2002年9月22日・読者投稿(こいけさん)・嵐を呼ぶ……

環境

入力値・期待値

みだしつき (見出し付き)

実績値

乱し付き

乱れがついているのかー。微妙。

(鶸俣昇)
こういう人とは、つきあっていて飽きないのかも知れません。
とってもうふふなこともあるかも。

2002年9月22日・読者投稿(こいけさん)・いくら友情があっても

環境

入力値・期待値

ゆうじょううん (友情運)

実績値

友情ウン

頷いているのかそれとも、、、、

(鶸俣昇)
そ、それとも、、、、、、

2002年9月22日・読者投稿(こいけさん)・なんだ

環境

入力値・期待値

かしまだ (鹿島田)

実績値

貸間だ

逆切れ?

(鶸俣昇)
いや、未知の事実を発見して思わず漏らしたひとことでは。

2002年9月22日・読者投稿(こいけさん)・新しい世界へ

環境

入力値・期待値

ひこうしんりょういき (非更新領域)

実績値

飛行新領域

どこへ行っちゃったんだろう?

(鶸俣昇)
そりゃああっちです、あっち。 んふふ。

2002年9月22日・きゃべつ

環境

入力値・期待値

こきゃくべつ (顧客別)

実績値

濃きゃ区別

色でも顔でもマニアでも、濃きゃ区別。

2002年8月22日・読者投稿(さとーさん)・血迷ってる

環境

入力値・期待値

すけじゅーる (スケジュール)

実績値

ス家ジュール

2002年7月27日・読者投稿(さとーさん)・項目値

環境

入力値・期待値

こうもくち (項目値)

実績値

工も朽ち

……そうですか。工も朽ちますか。
こんなものもあんなものも時が経てば朽ち果ててしまうのだから、 工が朽ちたって不思議ではあるまい。
しかし、工ってなんだ。

(ちょっと鶸俣昇さん風にコメントしてみた、つもり) (^^;;;


◆nulplenoコメント◆
これはすさまじい変換ですね。
あらゆるものが朽ちてゆくこの世界において、ちっとも不思議ではない ものの(笑)
# それにしても工ってなんだ(爆)

2002年7月23日・むす

環境

入力値・期待値

むすこさん (息子さん)

実績値

蒸す古参

きっっとなあ。古参がたくさんいて、蒸してるんだろうなあ。 古参って、おおむね鬱陶しいもんなあ。蒸すよなあ。夏だし。

2002年4月2日・読者投稿・草木

環境

入力値・期待値

きゃくさき (客先)

実績値

きゃ草木

やっぱり真面目に仕事してると出るらしい。


◆nulplenoコメント◆
真面目に仕事しているらしい。

2001年10月22日・読者投稿・のみ

環境

入力値・期待値

とらわれのみ (囚われの身)

実績値

囚われノミ

ノミは難しい。。。


◆nulplenoコメント◆
「うんぬ」は「囚われのみ」でした。Only 囚われ。
ロン。囚われのみ。一飜。(とゆーよりはちょんぼか)

投稿者からは「出るときは連発」ともコメントがありました。
確かに。
狙っておるのだ、やつら。

それはそれとして、そろそろ目次をつけないと見づらい程度にたまって きましたか?

2001年10月22日・読者投稿・ず

環境

入力値・期待値

おくらず (送らず)

実績値

お蔵図

どんな図やねん。 (--;;;


◆nulplenoコメント◆
ノーコメントでっす。

投稿者からは「まともに仕事しようとすると誤変換が出るという法則が あるらしい」ともコメントがありました。
確かに。
狙っておるのだ、やつら。

2001年10月22日・読者投稿・みかん

環境

入力値・期待値

みかんりょう (未完了)

実績値

みかん量

「処理がみかん量」っていったい。 (^^;;;
みかんの量ではかられてもねぇ...


◆nulplenoコメント◆
シアトルは「季節感反映機能搭載日本語入力システム」を開発したらし い。
収穫の秋。食欲の秋。

2001年10月22日・読者投稿・そうちかん

環境

入力値・期待値

ほぞんそうちかんつうしん (保存装置間通信)

実績値

保存総置換通信

保存したはいいけれど、すべて置き換えられた上で通信されるらしい。
新種ウィルス発生。


◆nulplenoコメント◆
「ちかん」が「置換」で済んだのはひとえに使用者の人徳の賜物でしょ う。たぶん。わからないけど。

2001年10月6日・ぼくもしんじたい

またまた読者投稿です。

環境

入力値・期待値

しんじたい (信じたい)

実績値

新事態

◆nulplenoコメント◆
正確には、「バグではなく仕様としんじたいです」と打ったら しいです。
「バグではなく仕様と新事態です」。障害とともに新しい何かが起こっ ている……迫り来る恐怖。修羅場の到来か?

2001年10月5日・せいなんておち

読者投稿です。

環境

入力値・期待値

このせいなんておちはないよね  (このせいなんて落ちは無いよね)

実績値

この西南手落ちは無いよね

うーむ、北東手とか色々な手法があるらしい。 こんな手があるのは将棋か囲碁かはたまた?


◆nulplenoコメント◆
これはまたすごい変換。 「口語変換」に弱いだろうと想像しても、なおスゴい。
しかも変換結果が絶妙で、泣かせます(^^) \(--#) 泣いてないぞ

しかし、囲碁将棋方面というよりは、やはり風水か陰陽道方面では?
安部晴明とかが。結界の張り方をひと目見て。
(ずいぶん気さくな晴明だ)


実はもう一個。

入力値・期待値

きたいち (期待値)

実績値

来た位置

ありがち。

2001年10月3日・けいしき

読者からの投稿です。しかも2件!
なんか、さいきん、誤変換ラッシュであります。

環境

入力値・期待値

けいしき (形式)

実績値

け意識

いったいどこのなんの「け」かは知らないが何らかの意識があるらしい。


入力値・期待値

はつとうこう (初投稿)

実績値

初と浮こう

「お初さん、おれと一緒に死んでくれ」じゃないよな。


◆nulplenoコメント◆ ある意味「かないさんちゅうしんでやる」の 対極かもしれませんね。ある意味。

2001年10月2日・恐竜たちの疾駆

環境

入力値・期待値

じゅらしっくぱーく (ジュラシックパーク)

実績値

ジュラ疾駆パーク (MS-IME)
寿ら疾駆パーク (Wnn98)

Wnnの方がめでたげだからWnnの勝ち。(そーゆー問題じゃない)

『「寿」たちが疾風のごとく駆け回るパーク。 楽しいやらおそろしいやら』とのご意見も。

2001年9月28日・Wnnちゃん甘ったれるんじゃありません

環境

入力値・期待値

いたくないよう (委託内容)

実績値

痛くないよう

これなどMS-IMEでもやってくれそうな。と思っていたら、案の定MS-IME でも同様とのこと。かなり普遍性の高い(?)誤変換ではあるまいかと。
しかし、「痛いよう」なら話は判るんだが、これはどうやってなだめた ものか……

さらに派生形(?)も報告されています。

入力値・期待値

ないようがないようだけに  (内容が内容だけに)

実績値

内容がない様だけに

報告者コメント

そりゃまぁたいした内容の話じゃなかったけどそんな言い方って... (T_T)

ちなみに変換の第2候補は「痛くない様」でした。
痛くなる前にそうならないように何かするらしい。(^^;;;

2001年9月22日・WnnさんWnnさん・しきゅうへんじこう

環境

入力値・期待値

しきゅうへんじこう (至急返事乞う)

実績値

氏急変事項

…………
××氏急変事項。
それでもヘン。

2001年9月20日・Wnnったら……・ごくいちぶ

環境

入力値・期待値

ごくいちぶ (ごく一部)

実績値

極意恥部

…………
まぁ、極意があるのかも知れない。

2001年9月17日・Wnnよ何処へ行くんだってば・あんちぱたーん

環境

入力値・期待値

あんちぱたーん (アンチパターン)

実績値

安置パターン

……あながちむちゃくちゃな変換とはいえないが。
いろいろな置き方があったらしい。

2001年9月17日・Wnnよ何処へ行く・にほんきかくきょうかい

環境

入力値・期待値

にほんきかくきょうかい (日本規格協会)

実績値

二本木か苦境かい

頑張れ二本木! 明けない夜はない。

2001年9月12日・Wnnよ何処へ行く・まどろっこしい

環境

入力値・期待値

まどろっこしい (まどろっこしい)

実績値

窓六個私意

この変換に驚いて新明解国語辞典第五版を繙いたところ、正しくは「ま だるっこしい(まだるっこい)」で、「まどろっこしい」は俗語、方言の ようなものらしいと判明。
本件はWnnの勝ち。
しかしそうなると、「まどろっこしい」を何の疑いもなく変換する MS-IMEやVJE-Deltaの立場は……

2001年6月29日・もうけもの

環境

入力値・期待値

もうけもの (儲けもの)

実績値

もう獣

狼男か、おまえは。

なおこれに触発されて、読者サイトで次の事例も発見された。

入力値・期待値

なまけもの (怠け者)

実績値

生獣

2001年6月22日・じゅこうび

 読者からの投稿でっす。以下におたよりから抜粋します。

環境

入力値・期待値

じゅこうび (受講日)

実績値

寿交尾

投稿者曰く、「なにがそんなにめでたいのか... それは謎」だそーです。

この報告を受けて誤変換調査隊が出動したところ、以下のものもR指定 を受けていることが判明。

2001年4月17日・ちょうほうきてきそち

環境

入力値・期待値

ちょうほうきてきそち (超法規的措置)

実績値

重宝汽笛措置 または 諜報汽笛措置

何やら役に立つみたいだけど極秘裡に活動する汽笛らしい。
それにしても、互いに異なるふたつの日本語入力システム/FEPで同じ 変換をするのは珍しい。

2001年2月14日・女王さまが好き・または・女王さまとお呼び

環境

入力値・期待値

きんむち (勤務地)

実績値

金鞭

かんなはもともとお茶目な子なんだが、それにしてもやってくれるわい。

2001年2月7日・タイムリー

環境

入力値・期待値

いじょうけんちじ (異常検知時)

実績値

異常県知事

確かこのころはどこかの県知事が何か新聞ネタになったか何かしていた のではあるまいか。脱力しながらも、なかなか味な変換をするものだと 思ったことです。

2000年12月27日・何者?

「誤変換の窓」中、脱力度ランキング一位の座をあらそう最有力候補で はないかと。

環境

入力値・期待値

かんりたいしょうとなる (管理対象となる)

実績値

寛李大○となる

 これには説明が必要でしょう。上の変換結果は、「かんりたいしょう」 が「かん」と「りたいしょう」に分けられそれぞれ変換されたものです。 なので「かん」の部分はその時時で変わります。が、「りたいしょう」 は燦然と輝き続けてそこに存在しています。

 上の○の部分は、MS-IME97の変換ではちゃんとした字が出ます。「金 偏にりっとう」といった感じの字です。ところが、変換中は表示される のですが、確定すると、たとえばMeadow(Emacs)のようなアプリケーショ ンでは表示されません。UnicodeにはあるけれどもJISコードには載って いない字なのではないかと思われます。MS-Wordでは表示されます。メ モ帳でも表示されます。そーゆー字を含む文字列を辞書にしまっておく 神経には「ぉぃぉぃ」であります。

 というところも不可解で不気味なんですが、なにより不気味なのは、 人名のように思えるのだけれど、「りたいしょう(李大○)」って誰?  ということ。ぼくは不勉強にしてそのような名前の人は知らないし、世 界史の中でもお目にかかったことはないと思います。そーゆー人名(?) を平気で出すMSには頭が垂れ下がります。それとも有名人なんでしょう か。

 今のところ誤変換調査隊は次のいずれかと推定しています。

  1. Windowsを中国向けにポートした中国人ハッカー(シアトル勤務)
  2. MS-IMEをいじくった中国人ハッカー(シアトル勤務)
  3. 実はウィルス(恐)。全世界N千万本のMS-IMEが感染ずみ

 まーとにかく最初に遭遇したときは呆気にとられたです。これほど脱 力した「誤変換」はないといっても過言かも知れませんがそんな気分。

 なお、この事例はMS-IME2000でも発生することを確認しています。お 楽しみ、もといお確かめください。

2000年5月22日・けいしきけんさ

環境

入力値・期待値

けいしきけんさ (形式検査)

実績値

軽視危険さ

確かに危険ではあるけれども。「さ」と軽く言い切られても。

有史以前の英雄たち

 誤変換を記録に留めて後世の研究に委ねようと思い立ったことはあり ませんが、 電子メイルで知らせること(「能書き」参照)を始めたのが いつの頃だったか思い出せません。1996年頃には始めていたような気も しますが、1999 年くらいからかも知れません。そんな、古いメイルに 埋もれていた歴史的な誤変換たちです。日付はいずれ発掘できるかも知 れないけど、今は判らず。
古いからといって侮れません。

環境

入力値・期待値

かないさんちゅうしんでやる  (金井さん中心でやる)

実績値

家内山中死んでやる

とあるプロジェクトがあって、そこに金井さんという人がいて、で、何 かの作業を金井さんが中心となって行なうということを書こうとした。
そんな事務的な文章が一瞬にして凄絶で怨みに満ちた遺書(?) に化け てしまう。妻よ、許してくれ。と誰しも思わず謝ってしまうほどに、入 力システムの脅威をまざまざと見せつけた事件でした。
日本語入力システムという「IT革命」が私たち市民の生活に及ぼす影響 をもう一度考え直すべきなのではないだろうか(ニュースキャスター風)

こんなメイルを受け取ったら、いや〜な気分でしょうね。


入力値・期待値

にゅうりょくち (入力値)

実績値

乳緑地

たしか、まさに『誤変換の窓』を果敢に書かんとして遭遇。
もとの誤変換と合わせてダブル脱力状態に陥ったような記憶がないでも ない。

朝靄の立ち込めた緑の草原といった詩的な風景を思い出させないでもな いわけでもないことはないかも。


入力値・期待値

にゅうたいしつ (入退室)

実績値

乳体質

これが一番古いような気がする。なんとなく。
なんかこれを契機にして、しばらく乳にまとわりつかれたような気もし なくもない。もちろん日本語入力の話。

体質じゃぁねぇ。しょうがないよね。

表題の「謎の文字列」

 Io videblas tra fenestro. これはエ スペラントという言語の文で、『窓を通して何かが見える』といっ た意味です。("videblas" は、ホントはちょっとお行儀が 悪いですが)

 タイトルバーにもエスペラントが現れています。

 Eniga-metodoj ofte petolemas. こちらは、まさにこのページのタ イトルらしく、『入力システムってけっこうお茶目』といった意味です。

先頭に戻る

能書き

 「誤変換」とは何か? ――ここでは、まず、次のように定義してお きましょう。

「日本語入力システムが、使用者の意図とは異なる変換をした中でも、 唐突でありひときわ使用者の力が抜けるもの。ただし、単にある文節に 対して異なる語句が選択されるのではなく、使用者が思いもかけない文 節区切りで思いもかけない候補が選ばれるのが望ましい」

能書き読むの止めて先頭に戻る

 日本向けのコンピューターには否応なく「日本語入力システム」とい うものが載っていて、コンピューターを使う人たちの日本語入力を助け たりジャマしたりしてくれています。

 これらの日本語入力システムは、基本的に冗談が好きで、「変換効率 Nパーセント!」なんてことをうたい文句にしている一見まじめそうな ヤツですら、時として一発芸に打って出ます。それはあまりに意表をつ くので――大体まじめに文章を書いている時に起こり、しかもとんでも なく「意味を取り違えている」か「なぜこんな変換をするのかわけが判 らない」かなので――、変換結果を目にした瞬間、笑うより怒るより先 にへなへなと机に突っ伏してしまう、そんなものがあります。

 これをひとりで楽しむ(?)のはいかにももったいない。そこで、心の 琴線に触れる――すなわち脱力感漲る「誤変換」に出会うたびに、メイ ルマガジン(うそ)としてごく少数の友人に知らせることにしました。最 初は不定だったタイトルも、じきに「誤変換の窓」に統一されました。 ウェブページにしようなどとは思ってもいませんでした。似たような企 画はどこでもやってるし。

 驚いたことに、メイルマガジン(うそだってば)を始めるや、全国津津 浦浦から「わたしも遭遇した」「やってみたら確かにそうなった」「自 分のところではこんな変換例があった」「わが家では夕食時の娘との対 話に『誤変換の窓』を活用しています」「うちは朝晩二回欠かしたため しがない」「『誤変換の窓』を読むと、彼……すごいんです」「やっぱ り池脇千鶴はかわいい」といった反響がたくさん寄せられたではありま せんか。

 「誤変換の窓」がこんなにもコンピューター利用者の共感を呼ぶとは 知りませんでした。あまつさえ親子の対話の促進にも貢献している。そ れでなくとも池脇千鶴はかわいい。これをごく少数の人の特権的所有物 にしておくのは人類のコンピューター文化にとって大きな損失とさえ言 える。そう喝破したのが誰か知りませんが、ウェブページとしての公開 に踏み切った次第です。

 いわゆるパソコンを買い、買ってきたまま日本語を使っている人は知 らないかも知れませんが、世の中には実にさまざまな日本語入力システ ムがあります。次の表にぼくが知っているものを挙げます。○は使った ことがあるもの、△はちょっとは使ったもの、―は使ったことがないも のです(当該プラットフォームの版が存在しない場合も含む。正確さは 保証しません)

さまざまな日本語入力システム(一部)
MS-DOSWindows MacintoshUNIX 備考
MS-IME ご存じMS-Windowsに標準搭載の日本語入力システム。
ことえり ご存じマッキントッシュに標準搭載の日本語入力システム。 登場した頃ちょっとだけ触って、やめた。
EGBridge マッキントッシュのワードプロセッサEGWordに添付の日本語入 力システム。ちょっとだけ触って、やめた。
VJE MS-DOSの頃からある日本語入力システム。
でもマッキントッシュ版でファンになった。 Windows版は、買ったけれどもう使っていない。
ATOK MS-DOSの頃からある日本語入力システム。
有名だがほとんど使ったことがない。
WX △? △? MS-DOSの頃からある日本語入力システム。
DOSでは世話になっている。マッキントッシュ版は買ったけど大して 使わなかった。Windows版も買ったかも知れないが使わなかった。
かんな UNIX生まれの日本語入力システム。
FreeBSDの住人になった時、使い始めた。文句は数えきれな いけれど、けっこう気に入ってる。
Wnn UNIX生まれの日本語入力システム。「うんぬ」と読む。
でもUNIXでは敬遠していて、なぜかWindows版から使い始 めている。


 ここで「私的日本語入力システム論」「私説日本語入力システム放浪 記」をやってもいいのですが、そうすると話が遥かハッブル・ディープ・ フィールドの彼方まで逸れてしまうのでこらえておきます。

 それぞれの入力システムにそれぞれのクセがあり、使い比べてみるの も楽しいものです。変換のクセもありますが、使い方のクセもあります。 日本語(に限りませんが)入力システムはユーザーインターフェイスの尖 端でもあり、有限個のキーの有限回の操作で如何に目的とする文字列を 入力するかという問題に対する、それぞれのインターフェイスデザイナー の設計思想の現れでもあるのですが、といった風に遥かハッブル・ディー プ・フィールドまで走ってしまうのでやめておきます。

 とはいえ、脱力してばかりではコンピューター言語学者(うそ)の名が すたるというもの。脱力を続けながらもスルドク観察することは怠って はなりません。観察と考察は研究者には欠かせぬ行動であります。忙殺 されれば申し分なし、悩殺までできれば最高と言われております。盗撮 はいけません。犯罪でふ。

 「誤変換」を子細に吟味すると、日本語入力システムの多く(といっ てもそんなに多くのシステムを試してはいませんが)は入力文字列を末 尾から走査・解析していくらしいことがほの見えてきます。たとえば 「けいしきけんさ」が好例でしょうか。「にゅうりょくけんさ」と比べ て見てみましょう。

  1. 末尾から「さ」→「ん」→「け」という風に文節をとっていく。
  2. どちらも「けんさ」までとったところで「検査」にヒットする。
  3. が、後者はそのまえの「く」をとると「くけんさ」になり、これに はヒットする変換候補がない(たぶん)。
  4. それに対して前者は、「き」をとると「きけんさ」になり、これは 「危険さ」にヒットする。
  5. かくして「けいしきけんさ」は「軽視危険さ」という「誤変換」を 生む。

 なぜ末尾からとるかというと、先頭から文節をとっていくと、「けい し」なのか「けいしき」なのか自分では判定できないからでしょう。 「けいし」で切った場合に残りの入力が意味のある文節に切れるかどう かは、先を読まないと判りません。切れなかった場合は文節を伸ばした り縮めたりして再試行しなければならず、これは専門的に言うとバック トラックが発生し、計算量が爆発的に増えるということです。末尾から 文節をとることによってバックトラッキングは押さえられます。

 といっても、日本語入力システムのメーカーに問い合わせていないの で真偽は定かではありませんが(以前とあるFEPのアルゴリズムを雑誌 で読んだが忘れてしまった)、自分の中では納得しています。つまり、 自分が日本語入力システムのデザインを手がけるとしたらやはりそうい うアルゴリズムをとるだろうという意味でです。

 なんてことを考えつつ見ると、「誤変換」がいっそう味わい深くなる こと請け合いです。保証はしませんが。

 顧れば「誤変換」というものは、コンピューターで日本語を扱い始め た頃からあった筈と考えられます。でも、昔はこういう「誤変換」が脚 光を浴びる(?)ことはそんなになかったように思います。昔とは、大雑 把に「MS-DOS時代」「Macintosh System6.04以前の時代」と言っていい でしょうか。まーその頃からWnnやかんなはあった筈ですが。

 昔の日本語入力システム(当時は「日本語入力FEP」といったものでし た) は連文節変換で、そんなに凝った変換はしませんでした。それが 「AI変換」とか「格フレーム変換」とかが出た頃からこのような脱力感 あふれる「誤変換」が増えたように思われます。変換のための解析を 「やり過ぎて」しまい、その結果、思わぬ文字列を候補にしてしまうの ではないでしょうか。また、変換のロジックや手法だけで「変換効率」 を上げるのは無理があるので、同時に「辞書を太らせる」こともします。 さまざまな文字列を予め辞書に放り込んでおけば、ヒットする可能性も 上がります。しかし、同時に、「ヘンなものにヒットする」可能性も上 がります。

 そもそも現在の日本語入力が「入力したい文字を直接に指し示す」方 式ではない以上、「誤変換」はつきものです。原理的に「変換率100パー セント」はあり得ません。変換の結果得られるべき「正しい語句」、あ るいは文脈と言い換えてもよいかと思いますが、それは常に書き手の側 にあるのであり、入力システムの関知できない領域にあります。どれほ ど入力を「正しく」解析して「適切な」変換を与えたとしても、語句の 「正しさ」を量るのが書き手である以上、それが常に「正しい」と言え る保証はありません。「飴が降ってきた」が「正しい変換」であるべき 文脈というのはあるわけです。

 従って「変換効率Nパーセント」とパッケージに謳っている日本語入 力システムは、何かしらの「統計学のウソ」をついていることになりま す。といっても、別にこの文句を非難するつもりはありません。測定の 基準を設けなければ意味のある測定にはなりませんから、たぶんこの場 合は「平均的な意味を持つ平均的な日本語の文章を入力する際の変換効 率」ということなのでしょう。

 しかし、すべての日本人が常に「標準的な日本語の文章」しか書かな いわけではないことは容易に想像可能です。すごく真面目な人がこの上 なく真面目に「『飴が降ってきた』という文は間違いである」と書くこ とは大いにあるわけです。小学校の先生なんか、国語のテストのために そうした「間違った文」をせっせと作ったりしそうですよね。たとえ 「変換効率99.99パーセント」でも、実際に使うときには大してご利益 にならないのです。――とはいっても、「平均的な場合」には平均的な 変換をして欲しいので、変換効率が高いことに意味がないといっている のではありません。

 また話が逸れましたが、そういう場に「AI変換」とか何とかが持ち込 まれるわけですから、われわれが「誤変換」と遭遇する割合が高まって いるのも当然という気がします。

 「誤変換」と、ずっと括弧つきで使っているのはそういう意味で、書 き手の意図からするとどうみても誤変換なんですが、彼または彼女は一 生懸命やった結果なのだから、「愚かものめ」と断罪するのはしのびな い。ちょいと惻隠の情なんぞをしのばせて括弧で括っておるわけです。 ここに挙げた「誤変換」たちも、使用者の過去の使い方や入力・変換の くせ如何によってはこのような「誤変換」にならない可能性があります。 その意味で、「誤変換」は人間(の振舞い)とコンピューター(の思惑)が 交差する刹那のまぼろし、相互不理解の残像と言って言えないことはな いのかも知れません。

 なーんつー能書きにだまされないように:-p

 脱力感いっぱいの「誤変換」を愛で、「おまえ、ばかだなぁ」と愛情 を込めてつぶやきませう。いや、もちろん、逆上してディスプレイを叩 き割りキーボードをへし折り窓から投げ捨ててもいいですが。でもその 前に窓ガラスを叩き割っておくことをお忘れなく。

このページ冒頭へ
ことばの森 目次へ
トップページへ
©Copyright Noboru HIWAMTA (nulpleno). All rights reserved.