平成22年国勢調査」が2010年10月1日に実施されました。皆さん、参加されましたか? 日本に住んでいるすべての人を対象とする統計調査で、人口の把握や暮らし向き、就業状況といった、様々な分野に関してデータで把握しようするものだそうです。

さて、「国勢調査」に限らず、世の中では、あらゆるものが統計データ化されていますね。数字になっていると、なんとなく説得力が感じられるので、やたらと多用したくなるものですが、実は、これを読み解くとき、意外に見過ごしやすいワナがあるそうです。このテーマについて、豪Lifehackerが採りあげています。

 企業のIT部門マネジャーや管理者向けに、社内のインフラをWindowsからMacへ移管するための情報を提供している「Enterprise Desktop Alliance(EDA)」が最近発表したある統計データ(英文)を、豪Lifehackerは例に挙げています。

これに関するEDAのプレスリリースでは「企業向けで、Macが市場シェアが57%増加」とのタイトルが....。このプレスリリースの関心を惹きつけるには、十分なキャッチコピーですが、実は、ここにはいくつかのワナがあります

そのひとつは、ここで引用されているパーセンテージは、最大限のインパクトを狙ったものであるという点。実際のデータを見てみると、Macの企業向けのシェアは、2009年が3.3%だったのに対して、2011年は5.2%になると予測しています。つまり、「3.3%」という、低い数値をベースとした増加率「57%」なのです。増加・減少といった変化をあらわす数値については「何から何への変化なのか?」も、あわせてチェックしたほうが、その数値が表す本当の意味を理解しやすそうですね。

もうひとつ気づくべきポイントは、「このデータは、正確にもたらされたと信じるに足るか?」という点。EDAによると、この調査は、2010年6月、100台以上のマシンを導入している企業の、IT管理者460名に対して実施されたものだとか。また、米国外からの回答は8%。米国と他の国の市場では、購買傾向が異なることがあるので、回答者の大部分が米国企業であるという点は、調査データとして正しいといえるでしょう。

ただし、この調査には大きな問題があります。それは、これがオンラインで実施され、EDA会員企業のメーリングリストで広報されたものであるということ。EDAのミッションが「Windows中心のIT環境から、Macへの移管のためのソリューションを提供すること」である点をかんがみると、回答者の多くは「WindowsとMacの導入」に関心を持っている可能性が高い、ということになります。

つまり、この種のアンケートデータを読むときは、「この調査結果にはどのようなバイアスがありそうか」、「何をベースにこの結果に至ったのか?」など、調査元の中立性や回答者の傾向なども、合わせて見ていくことが、データの「読み間違い」を防止する一法といえるでしょう。

数値化されているだけで、客観性と信頼性が必ずしも担保されているというわけではなく、これを読み解くときには、数字の裏に潜む背景にも注意を払う必要がある、ということのようですね。

このほか、データ活用のコツを採りあげた記事としては、ライフハッカーアーカイブ記事「統計のスペシャ リストが伝授、データを活用するときの5つの心得」も、あわせて参考にしてみてくださいね。

Basic Errors To Avoid When Interpreting Survey Statistics [Lifehacker Australia]

Angus Kidman(原文/訳:松岡由希子)