2024.12.09
2024.12.09
統計学的検定で数字に隠された真実を見抜く!
- 文字で構成されています。
※この記事内容は
ビジネスで新しい施策を行って売上が増えたり、顧客満足度が高まったりすると嬉しいものです。しかし、その成功は本当に施策を行った結果と言えるのでしょうか?
今回は、データ分析でそんな検証を可能とする統計学的検定をご紹介します!
統計学的検定とは?
統計学的検定とはデータ同士の差に意味があると言えるのか分析するものです。
例えば、キャンペーンの実施によって利益が増えていると言えるのか分析する、WebサイトのA/Bテストを実施してデザインの違いによってクリック率に違いが生じるか分析するといった場面で統計学的検定を活用します。
2つのWebサイト(AとB)などを提示して、どちらがより良い結果をもたらすか検証する実験です。
A/Bテストを実施して数字を比較することで根拠ある意思決定を行うことに繋がります。
新入社員のWebデザイナーXさんが新しくデザインしたWebサイトで旧デザインよりもアクセス数が増えて、統計学に詳しい先輩社員Yさんと会話している場面を考えてみましょう。
Xさん
自分の新しいデザインでアクセス数を増やすことができました!
Yさん
アクセス数が増えたの、ただの偶然じゃないですよね?
Xさんが喜んでいるところにYさんが水を差しています。人間関係に亀裂が生じかねないので関係構築という意味では不正解で空気が読めない発言かもしれません。
ところが、データ分析の世界ではYさんのツッコミが正解です。
Webサイトのアクセス数が数字上増えるのはもちろんいいことですが、学生時代にテストでいつもより良い成績が取れてしまうことがあるように、偶然上振れすることがあります。
単にデータの数字の差だけでは偶然であることを否定することができないので、数字が良くなっているのは必然なのか、それとも偶然なのか検証できる統計学的検定が役立ちます。
統計学的検定の考え方と流れ
統計学的検定の考え方の基本は、データ同士に差が出たのが偶然と仮定した上で偶然である確率を計算することです。偶然である確率が十分に低ければ、データ同士の差が偶然発生したことを否定して意味がある差だと考えます。統計学では、「統計的に有意」や「有意差」といった言葉がよく使われ、データ同士の差に意味があることを表します。
次の例を見てみましょう。
1日目 | 2日目 | 3日目 | 平均 | |
---|---|---|---|---|
デザインA | 1,000 | 1,200 | 1,100 | 1,100 |
デザインB | 900 | 1,000 | 1,100 | 1,000 |
ただ、日によってデザインAとデザインBの差には違いがあり、同数の日もあります。
統計学的検定ではこの3日間のデータを見て、アクセス数の差が果たして偶然レベルで生じたものなのかを計算しています。
統計学的検定は次のような流れで行います。
- データの差は偶然発生したと仮定する
- 偶然と仮定した時に、偶然である確率が何%以下なら偶然を否定するか基準を決める
(一般的には5%以下が基準) - 統計学的に偶然である確率を計算する
統計学的検定は数字の差を分析して偶然発生する確率が5%以下なら、偶然ではなく必然で発生したと考えます。Webデザインの例ならば、デザインの違いによってアクセス数の差が発生したと考えることができるのです。
次の節ではExcelで実際に統計学的検定を行って、例におけるWebデザインによるアクセス数の違いは必然で発生したのか、偶然で発生したのか検証してみましょう。
Excelで統計学的検定を実践!
統計学的検定には様々な種類があります。
例のようなデータで統計学的検定を行うにはt検定が適しているので、Excelでt検定を行います。以下では、デザインAの方がデザインBよりもアクセス数が多いと言えるのか検証することを目的としてExcelでt検定を行う操作方法を見ていきます。
2つのグループの平均の差が偶然か確率を用いて分析する方法です。例えば2つの店舗の1日あたりの平均来店客数や2つの営業チームの月間平均売上高の差を比較する場合にはt検定を用います。
-
Excelでt検定を行うにはアドインを設定する必要があるのでその作業を行います。
「ファイル」タブをクリックします。
-
「オプション」をクリックします。
-
「アドイン」をクリックした後、「設定」をクリックします。
-
「分析ツール」にチェックを入れて、「OK」をクリックします。
これでアドインの設定は完了です。
-
t検定を行います。「データ」タブのリボンから「データ分析」をクリックします。
-
「t検定:分散が等しくないと仮定した2標本による検定」を選択して、「OK」をクリックします。
-
「変数1の入力範囲」にB列3行目からE列4行目、「変数2の入力範囲」にB列4行目からE列4行目を選択し(平均を表すF列は含めません)、「ラベル」にチェックを入れて、「OK」をクリックします。
-
t検定の結果が出力されます。
-
データ同士の差が偶然発生する確率を調べるには、「P(T<=t)片側」をチェックします。
出力結果によれば0.14...となっているので、デザインAとデザインBのアクセス数の差が偶然発生する確率は約14%です。
この例のデータではデータ同士の差が偶然発生する確率が約14%です。
統計学の一般的な基準では、デザインAがデザインBよりアクセス数が多いと言えるには偶然である確率が5%以下である必要がありますが、14%では満たしていません。したがって、デザインAとデザインBのアクセス数の差はデザインの違いによって必然的に発生したとは主張できず、デザインAの方が優れていると結論づけることができないという結果になります。
つまり、アクセス数の差は偶然による誤差の範囲としてありうると考えます。
最後に
データ分析を行うと、データの単純な増減に注目しがちです。しかし、その増減に意味はあるのか、統計学を用いて検証しなければただの偶然に意思決定を左右されることになりかねません。
施策を行った結果の数字が施策による必然なのか、それとも偶然なのかを統計学的検定によって検証することで、より強い科学的根拠のあるビジネスの改善に繋がると言えるでしょう。
※本記事は2024年12月09日現在の情報です。
おすすめ公開講座
関連ページ
統計学、Python、Microsoft Excelの研修を通じて、ビッグデータの解析とデータサイエンスに必要な思考スキルを習得。
それぞれの研修で専門知識を深め、ビジネスに生かすことができます。
似たテーマの記事
2024 WINTER
DXpedia® 冊子版 Vol.3
Vol.3は「普及期に入ったAI」がテーマです。AI活用を見据え管理職2,200人を対象とする大規模なDX研修をスタートさせた三菱UFJ銀行へのインタビューや、AIの歴史と現在地に光を当てる記事、さらに因果推論や宇宙ビジネスといった当社の新しい研修ジャンルもご紹介しています。
Index
-
冊子限定
【巻頭対談】管理職2,200人のDX研修で金融人材をアップデートする
-
冊子限定
ChatGPTが占う2025年大予測
-
冊子限定
AI研究がノーベル賞ダブル受賞
-
冊子限定
チョコとノーベル賞の謎
-
冊子限定
宇宙ビジネスの将来
-
冊子限定
【コラム】白山から宇宙へ~衛星の電波を自宅でとらえた
2024 AUTUMN
DXpedia® 冊子版 Vol.2
『DXpedia®』 Vol.2は「サイバーセキュリティの今」を特集しています。我が国トップ水準のリスク関連コンサルティング会社であるMS&ADインターリスク総研の取締役に組織の心構えをうかがいました。このほかサイバー攻撃やセキュリティの歴史を当社エグゼクティブアドバイザーがひもといています。
Index
-
PICKUP
【巻頭対談】サイバー攻撃への備え 従業員教育が欠かせない
-
冊子限定
「復旧まで1カ月以上」が2割〜国内のランサムウェア被害調査
-
PICKUP
サイバーセキュリティ今昔物語
-
冊子限定
DXpediaⓇ人気記事
-
冊子限定
【コラム】白山から宇宙へ~アポロが生んだ技術の大変革
2024 SUMMER
DXpedia® 冊子版 Vol.1
IDAの新しい冊子『DXpedia®』が誕生しました。創刊号の特集は「ChatGPT時代」。生成系AIを人間の優秀な部下として活用するための指示文(プロンプト)の例を始め、Web版のDXpediaで人気を集めた記事を紹介、さらに宇宙に関するコラムなどを掲載しています。
Index
-
冊子限定
プロンプトでAIをあやつる~前提や体裁を正しく指示して完成度UP!
-
冊子限定
AIそれはデキる部下~インソースグループの生成系AI研修
-
冊子限定
AIと作る表紙デザイン~生成系AIを有能なアシスタントにしよう
-
冊子限定
【コラム】白山から宇宙へ~未来を切り拓くSX(
-
冊子限定
DXpediaⓇ人気記事
2023 AUTUMN
Vol.12 今日からはじめるDX
Vol.12は「中堅・成長企業でのDXの進め方」がテーマです。他社リソースを上手に活用するために身につけたい「要求定義と要件定義」を解説しました。 2人の「プロの目」によるDXの取組みへのヒントに加え、身近なアプリではじめるDXを活用事例とともに紹介します。DXお悩みQ&Aでは、中小・成長企業特有の事例を取り上げました。DXをはじめるなら「今」です。
Index
2023 SPRING
Vol.11 DX革命 第二章~着手から実践へ
vol.4の続刊であるVol.11は「DX革命の実践」がテーマです。 本誌の前半ではDXの課題を4段階に整理し、各段階の解決策である研修プランを掲載しています。 後半では弊社が研修を通じてDXを支援した、各企業様の事例と成果を紹介しています。自社のDX実践に際して、何がしかの気づきを得られる内容となっています。
Index
2020 WINTER
Vol.04 DX革命
Vol.04はDX推進のための効果的な手法がテーマです。DXは喫緊の経営課題である一方、IT人材不足や高いシステム導入コストにより実現が難しいと捉えられがちです。そこで本誌では、今いる人材で低コストに推進するDXについてご紹介しております。
Index
お問合せ
まずはお電話かメールにてお気軽にご相談ください
お電話でのお問合せ
03-5577-3203