« フレッシャーズゼミ 新入生交流会 「バーベキュー大会」 | トップページ | メディアサイエンス専攻:大学院進学の勧め »

f : X→Y ?

|

  しばらくご無沙汰していたが、面白メディア学「データから社会経済の動きを探る技術」シリーズ、今回は「f : XY ?」と題して、データ項目間の対応関係を考えてみよう。表題からは数学の話を連想されるかもしれないが、データ編集において必須の、単なる項目間の対応関係の話であるので、ご安心あれ。

さて、社会の実態を正確に、かつタイムリーに捕捉することは、個人の意思決定から、企業の戦略策定、自治体や国の政策にとって不可欠であることはこのシリーズで何度も強調した。その実態として集めた生のデータを、いろいろな目的に合うように加工編集することで、分析が行えるようになる。すなわち、データは、実態が補足され、かつ利用目的に応じた加工編集が適切に行われていないと、いくら高度な統計的分析を行っても無意味である。

この、加工編集のプロセスが、データ編集のために開発された、代数的会計記述言語AADL(Algebraic Accounting Description Language)の真価を発揮する場面である。そして、利用目的に応じた加工編集のためには、利用目的にかなった分類概念でデータが編集されていることが必要である。その手続きが「f : XY(そして「f -1: YX)で、今回のテーマである。このデータ項目間の分類概念には、集計と按分がある。より上位の概念に変換する手続きが集計で、より細かい項目を作り出す手続きが按分である。

例えば、スーパーの店舗風景を考えてみよう。食品を中心として非常にたくさんの品物にあふれていよう。よく見ると、野菜・果物、鮮魚、肉類、加工食品等、いくつかのエリアにまとまってレイアウトされている。さらに、果物のコーナーでも、リンゴ、かんきつ類、メロン、バナナなどさらに小さなまとまりの中で陳列されている。つまり、下記表のような対応関係の下に店舗の棚も作られているようである。

正確なものではないが、総務省の商品分類を基にした対応表が下記の表である。例えば、リンゴ、ミカン、ぶどう等は果物という小分類項目に集計され、キャベツ、トマト、ジャガイモ等の品目は野菜という小分類項目に集計される。そして、果物、野菜は、農産食品という中分類項目に集計され、さらに、畜産食品、水産食品等とともに、大分類の食料品に集計される関係が示されている。このような分類表に基づき、果物、野菜等の小分類単位の生産額や、両者を集計した農産食品という単位での生産額を計算し、わが国の食糧事情の実態や課題がどの分類にあるのか、などが実態として明らかになるわけである。このように、データは、分類と対応関係がきちんと定義されることで、いろいろな目的に応じた項目粒度で集計され、様々な戦略や政策のエビデンスとして利用できるのである。

(資料)総務省「日本標準商品分類」

さて、表の下段にテレビという小分類項目がある。その品目に、ブラウン管式と液晶式がある。かつてテレビはブラウン管式で、現在おそらく購入可能な家庭用テレビはほぼすべて液晶式であろう。両者が生産されていた時期には、それぞれの生産実績に基づき品目別にデータが作成されていたが、ブラウン管式の生産縮小に伴い、品目別のデータ収集が困難になる。しかし、困難であっても、生産が継続している以上データの連続性は必要である。そこで、テレビという小分類項目の集計データが入手できれば、ブラウン管式と液晶式の生産割合を推計のうえ、ブラウン管式のデータを推計する。この(逆の)対応関係が按分である。

最後に、少し補足しておこう。これまで、リンゴ、ミカン、メロン等を品目と記述してきた。しかし、スーパーの店頭に、「リンゴ」という名のリンゴは売っていないし、買うことはできない。実際にスーパーで売っている「リンゴ」は、例えば、ふじ、つがる、紅玉、王林などの品種で、等級ごとに価格も違う。さらに産地も表示されている。われわれが店頭で実際に購入できる「リンゴ」は、このような単位のもので、上記の表の「品目」から項目をさらに細分化する必要がある。

(資料)ホクレン、青森リンゴの会のHPを参照

スーパーのばら売りやパックにこのような等級は表示されていないかもしれない。しかし、棚の近くに納入用の箱が置いてあれば、出荷元の産地・農協の表示とともに、このような等級が表示されているはずである。また、等級も産地ごとに決められている。今度スーパーで買い物をするときには確かめてみてほしい。

(メディア学部 榊俊吾)

おもしろメディア学」カテゴリの記事

« フレッシャーズゼミ 新入生交流会 「バーベキュー大会」 | トップページ | メディアサイエンス専攻:大学院進学の勧め »