[ 通常表示 ]  [ 簡易表示 ]  [ シンプル表示 ]

「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典イメージぴよ画像「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典

文字化け

pointこの用語のポイント

point文字が変な表示になっちゃうことだよ

point原因の多くは、変換ルールの解釈間違いか、区切り箇所の勘違いだよ

スポンサーリンク

簡単に書くよ

文字化けとは

文字通り文字が化けること
です。

image piyo

詳しく書くよ

そのまんまですな。
要は文字が意図しない表示になっちゃうことです。

文字化け

原因は二つ考えられます(--)b

1.送り手と受け手の変換ルールが違う場合
2.変なところで区切られちゃった場合


のどちらかです。
そして大抵は「1.」が原因です。

忘れがちですがコンピュータさんの世界には0と1しかありません。
その0と1の組み合わせにあれやこれやと意味をつけて文字を表現しています。

ですから送り手と受け手が0と1の組み合わせに同じ文字を割り当てていないと意志疎通がうまくいかないのですよ。

例えばネットワークの中を通っているときの文字は

00000101
00000110
00001100


のような感じになっています。

これをコンピュータさんが画面に表示するときに





のように「0、1の組み合わせ」を「文字」に変換してくれているのです。

このときの変換ルールには実はいくつか種類があります。
よく使われるのは「Shift-JIS」「EUC-JP」「UTF-8」などですね。

さて、ここで送った方は「『Shift-JIS』ルールで変換して読んでね」なつもりで送ったのに、受け取った方が「『UTF-8』ルールで変換して読むよ」となったらどうでしょう?

送った方が意図しない文字に変換されちゃいますよね?
その結果として意味の通らない文章になっちゃうかもしれません。

この認識のズレが文字化けの原因「1.送り手と受け手のルールが違う場合」です。
文章全体が文字化けってるときは大抵これが原因です。

「2.変なところで区切っちゃった場合」はどちらかと言うと例外です。
「勘違いする」という点では「1.」と同じなのですが、いわゆる「ぎなた読み」のような事態がたま~にあるのです。

例えば

00000101 00000110 00001100

というデータ送られてきたのに、受け手が

0000 01010000 01100000 1100

と解釈しちゃったりですね。

送り手:弁慶が「なぎなた」をふりまわし
受け手:弁慶がな、「ぎなた」をふりまわし


のような哀しいすれ違いです。

専門用語を駆使すると、マルチバイト文字に「5C」が含まれる場合に「\(円マーク、バックスラッシュ)」と解釈されちゃってうんちゃら、とか。
文字列ぶった切ったらマルチバイト文字の途中でぶったぎっちゃってかんちゃら、とか。
そんなのが原因です。

全体が化けないで一部だけ化ける場合はこちらを疑って下さい。

image piyo2

一言でまとめるよ

まぁ「文字化け」って単語が出てきたら「書かれている文字の解釈をコンピュータさんが間違ったまま無理やり読んでるんだな~」と、お考えください。

一番上に戻るよ
スポンサーリンク