UTF8エンコードをデコードする

   use=147456  dl=4096

このページは、文字列の UTF-8 エンコードをデコードし、各文字のUnicode番号(U+XXXX)を得ることができます。 実用には向きませんが、短かい UTF-8 文字列の手軽な解や、あるいは UTF-8エンコーディングの入門学習に向いています。

下記いずれかを入力して『デコード実行』を押してください。
テキスト入力

8進入力
1バイト毎に非数字文字で区切ってください。 各バイトの8進数をゼロで始める必要はありません。
例: 343 201 202


16進入力
1バイト2桁で表記してください。区切の有無は自由で、非英数字は無視されます。 例: e38182


URLエンコード
%XXの形式の16進表現と通常文字の混在が可能です。 例: AB%E3%81%82C



第 1 行
入力の
解釈
入力値
文字
8進
10進
16進
UTF-8
結合
チェック
実行
Unicode 番号
文字


UTF-8結合の説明
01バイト文字を意味するビットパターンです。
1102バイト文字の先頭バイトを意味するビットパターンです。
11103バイト文字の先頭バイトを意味するビットパターンです。
102バイト以上の文字中の、継続バイト(第2バイト以降)を意味するビットパターンです。
xx各種の先頭バイトにあるビットパターンのうち、自身が表現するバイト長と伴う継続バイト数が不一致のものです。 これが現われたときは、入力文字列はUTF-8でもASCIIでも無いコードかも知れません。

このCGIをゲットする (実行には Perl 5.6 以上が必要です。 他にも、サーバーが変ったら不都合が出るかも知れません)

姉妹CGI
  1. 非ASCII文字チェック
  2. Base64 デコード
  3. SJIS 第2バイトチェック