[ 通常表示 ]  [ 簡易表示 ]  [ シンプル表示 ]

「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典イメージぴよ画像「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典

正規化

pointこの用語のポイント

pointデータを整理するよ

スポンサーリンク

簡単に書くよ

正規化とは

データとかを使いやすいように整理したり変形したりすること
です。

image piyo

詳しく書くよ

正規化する対象は主にデータです。
データというのは何らかの形で利用されますよね。
そのデータを、利用しやすいように整理することを「正規化」と言います。

例えばあるところに

20歳でオスのピヨ太君はタケノコは好きでキノコは嫌い、
18歳でメスのピヨ子さんはキノコもタケノコも大好き、
45歳でオスのピヨ太郎さんはキノコは好きでタケノコは嫌い、
44歳でメスのピヨ美さんはキノコもタケノコも好き、
65歳でオスのピヨ蔵さんはキノコもタケノコも嫌い、
63歳でメスのピヨさんはキノコもタケノコも好き、


な6人家族がいたとします。
大家族ですね。きっと毎日ピヨピヨうるさいことでしょう。
これらの情報は「データ」です。でもごちゃごちゃしていてちょっと分かりにくいですよね。

例えばピヨ太郎さんが、仕事の帰りにキノコとタケノコを買って帰ろうと思いました。
好きな人が平等に1個ずつ食べるとして、それぞれ何個買えば良いでしょう?

正規化

先程のデータをパッと見てもよく分かりませんよね?
これではせっかくのデータがもったいないです。

そこでデータを見やすいように整理してみました。

■年齢
・ピヨ太君、20歳
・ピヨ子さん、18歳
・ピヨ太郎さん、45歳
・ピヨ美さん、44歳
・ピヨ蔵さん、65歳
・ピヨさん、63歳

■性別
・ピヨ太君、オス
・ピヨ子さん、メス
・ピヨ太郎さん、オス
・ピヨ美さん、メス
・ピヨ蔵さん、オス
・ピヨさん、メス

■キノコ派 or タケノコ派
・ピヨ太君、タケノコ
・ピヨ子さん、キノコ・タケノコ
・ピヨ太郎さん、キノコ
・ピヨ美さん、キノコ・タケノコ
・ピヨ蔵さん、なし
・ピヨさん、キノコ・タケノコ


おぉ、さっきより見やすくなりましたね。
「キノコ派 or タケノコ派」を見て数を数えれば、キノコ好きは4人、タケノコ好きも4人いることが分かります。

ピヨ太郎さんはキノコとタケノコを4個ずつ買って家路につきました。めでたしめでたし。

このようにデータを見やすいように整理したり変形したりすることを「正規化」と言います。

注意点として正規化のやり方には絶対の正解はありません。
どのように正規化するか、どこまで正規化するかが作業する人の腕の見せ所になります。

例えば先の例では

■キノコ派 or タケノコ派
・ピヨ太君、タケノコ
・ピヨ子さん、キノコ・タケノコ
・ピヨ太郎さん、キノコ
・ピヨ美さん、キノコ・タケノコ
・ピヨ蔵さん、なし
・ピヨさん、キノコ・タケノコ


と整理(正規化)しましたが、

■キノコ派
・ピヨ子さん
・ピヨ太郎君
・ピヨ美さん
・ピヨさん

■タケノコ派
・ピヨ太君
・ピヨ子さん
・ピヨ美さん
・ピヨさん


と整理した方が便利じゃね?と考える人もいるでしょう。
それはある意味正解です。
「キノコ好きとタケノコ好きがそれぞれ何人いるか」ということを知りたいのであれば、あらかじめキノコ派とタケノコ派を分けて管理していた方がパッと見で分かりやすいですよね。

ところが「キノコもタケノコも好きな人は何人いるか?」の場合はどうでしょう。
最初の「キノコ派 or タケノコ派」と整理したときの方が見やすいのではないでしょうか。

このように整理の仕方にはいろいろあって、そのどれもが状況次第で正解にもなり間違いにもなります。
そのため正規化の仕方に正解はありません。

とは言え、状況によっての正解はありますけどね。
正規化する際には「そのデータをどのように活用するのか?」を常に意識してあげてください。
別に正規化に限った話ではありませんが「やりたいことがやりやすい」のが正解ですよ。

image piyo2

一言でまとめるよ

まぁ「正規化」って単語が出てきたら「使いやすいように整理することなんだな~」と、お考えください。

一番上に戻るよ
スポンサーリンク