2024.03.25
2024.07.12
ChatGPTで本格データ分析!~事例①:A/Bテストの効果比較
- 文字で構成されています。
※この記事内容は
ChatGPTでデータ分析もできる
皆さん、ChatGPTは普段から使っていますか? メール作成やリサーチ、プログラミングのコードチェックなど、その万能さから既にさまざまな業務で活用している方もいるのではないでしょうか。そんなChatGPTの、ある機能を使えば、統計の本格的な知識がなくても驚くほど実践的なデータ分析までできてしまいます。
ChatGPTには多くの機能が備わっています。その中のひとつが「Advanced Data Analysis(高度なデータ分析、旧名:Code Interpreter)※」。データを読み込んでプログラミング言語Pythonのコードを実行し、高度なデータ処理と分析を行うことができる機能です。
この機能で注目すべきは「データ分析の結果を考察し、示唆を与えてくれること」です。データ分析では一般的に、ExcelやR※、Pythonなどを活用しますが、これらができるのは数値を出すところまでで、数値を見て解釈・洞察するのは人間の仕事でした。ところがChatGPTに指示を与えるだけで、結果の解釈まで得られるようになり、データ分析のハードルが飛躍的に下がったのです。
ChatGPTで本格データ分析!
連載記事①:A/Bテストの効果比較 ★現在の記事
連載記事②:データ同士の関連性を分析して予測する
※Advanced Data Analysisは、かつては有料版でしか使えなかった機能ですが、2024年5月13日の大型アップデート以降、無料版でも制限つきで使えるようになりました。詳しくはこちらの記事「無料版でも有料版でも!ChatGPTを使おう①~どんな機能で何ができる?」をご覧ください
※R(アール)とは、統計解析向けのプログラミング言語、および、ソフトウェア開発環境です。データ分析や統計モデリング、機械学習プロジェクトなどに利用されています
分析事例:A/Bテストの効果比較
A/Bテストとは?
- AとBという2つのパターンを用意し、特定の項目がユーザーの行動に与える影響を評価する実験的な手法です。主にウェブサイトやマーケティングキャンペーンの改善に用いられます。
- たとえば、ある企業が新商品をプロモーションするためにWeb広告のデザインを2パターン(AとB)用意したとします。そして広告配信の結果、どちらの広告がクリック数などのユーザー行動をより多く促せたのか、数値の差を比較検証します。
- A/Bテストの例
- このように、どちらの広告がよりユーザーに訴求するのか、データ収集と分析で結論づけるのがA/Bテストです。
A/Bテストの検証方法
- 統計学を使ったデータ分析では、A/Bテストの数値を単純な大小の比較ではなく、その差が誤差レベルのものでないかを検証します。例として、内容が同じで件名(タイトル)だけが異なる2種類のメールを、宛先を無作為に分けて10,000通ずつ配信し、次のような結果が得られたとします。
-
配信数 開封数 開封率 クリック数 クリック率 メールA 10,000 3,000 0.3 150 0.05 メールB 10,000 2,500 0.25 200 0.08 - ※開封率は開封数÷配信数、クリック率はクリック数÷開封数で計算しています
- メール数値の単純な比較であれば、開封率が良いのはメールA、開封に対するクリック率が良いのはメールBです。ただし、この差は偶然発生したものかもしれないので、統計学でこの差を検証していきます。
ChatGPT 機能「Advanced Data Analysis」を使った検証
- ChatGPTの有料版にはファイルを添付する機能があります。以下のとおり、入力欄の左側にあるクリップマークを押すと、添付したいファイルを選択できます。
- 先ほど例にあげたメールA,Bの数値データを分析させるため、Excelファイルを添付してChatGPT に読み込ませます。添付データをもとにA/Bテストの比較検証を行う場合は、次のようなプロンプトを入力します。
プロンプト例(入力した指示)
添付ファイルに基づいて、以下のステップに沿ってデータ分析を行い、分かりやすく簡潔に解説をお願いします。
#目的
2種類のメールの配信効果(開封率とクリック率)を統計学的に分析
メールAとメールBでは、どちらが開封率やクリック率が優れているか検証する
※開封率は開封数÷配信数、クリック率はクリック数÷開封数で計算している
#ステップ
ステップ1:目的に適した分析手法の選択
ステップ2:ステップ1の分析手法で分析した結果を表示
ステップ3:ステップ1、2で使用した専門用語の解説
ステップ4:分析結果の考察と今後の提案を専門用語なしで解説
こちらが指定したデータ分析の目的、求める処理のステップをふまえて、以下のとおりChatGPTが順次回答してくれます。
出力(出力された回答)
- ステップ1:分析手法の選択
- 開封率とクリック率の比較には、2つの独立したサンプルに対する比率の比較が適切です。このケースでは、2つのメールキャンペーン(メールAとメールB)の開封率とクリック率を統計的に比較するために、z検定を使用します。比率のz検定は、2つの独立した比率が統計的に有意に異なるかどうかを評価するための手法です。
- ステップ2:分析結果の表示
- 開封率の比較では、z値は7.92であり、p値は約2.41e-15です。このp値は0.05よりもかなり小さいため、メールAとメールBの間には開封率に統計的に有意な差があると言えます。具体的には、メールAの開封率の方が高いと結論付けられます。
- クリック率の比較では、z値は-4.54であり、p値は約5.67e-06です。このp値も0.05より小さいため、メールAとメールBの間にはクリック率に統計的に有意な差があると言えます。この場合、メールBのクリック率の方が高いと結論付けられます。
- ステップ3:使用した専門用語の解説
- z検定:2つの比率や平均値が統計的に異なるかどうかを検証するために使用される統計手法です。
- z値:標準正規分布を使用して計算される値で、2つの比率や平均値の差が偶然からどれだけ離れているかを示します。
- p値:帰無仮説(この場合は2つのメールキャンペーンの開封率やクリック率に差がないという仮説)が真である場合に、観測されたデータ(またはより極端なデータ)が発生する確率です。p値が0.05以下であれば、統計的に有意な差があると判断されます。
- ステップ4:分析結果の考察と提案
- 分析結果から、メールAは開封率が高く、メールBはクリック率が高いことがわかりました。つまり、メールAは受信者に開かれる可能性が高いが、メールBは開封された際にクリックに結びつきやすいと言えます。
- これは、メールAが魅力的な件名を持っている可能性が高い一方で、メールBは内容やCTA(行動喚起)がより効果的であることを示唆しています。今後の提案としては、メールAの件名の魅力を保ちつつ、メールBの内容やCTAの戦略を取り入れることで、開封率とクリック率の両方を最適化することを目指すべきです。また、異なるセグメントやターゲットに対して異なるアプローチを試みることで、より高い効果を期待できます。
- z検定という統計手法を使って、メール数値(AとB)の差が偶然生まれたものかどうかを検証するだけでなく、今後のメール施策で留意したほうが良いことまで提案してくれました。
- ※最初からChatGPTにz検定を行うよう指示することもできますが、ここでは「指示されなくても、ChatGPTが自ら分析方法を選択して処理を進められる」点にご注目ください
- ※プロンプトの入力時にメールAとBの違い(内容は同じで件名が異なる)を具体的に指定していなかったため、「メールBは内容やCTA(行動喚起)がより効果的であることを示唆~」と、推測に基づいた回答を出力してくれています
- このように、分析手法の選択からプログラムの実行、分析結果の考察と提案まで、指示するだけでChatGPTが自動で実行してくれます。さらにChatGPTの出力結果の文末にある[->]というリンクをクリックすれば、以下のように、分析に使用したPythonコードの中身も確認することができます。
最後に
ChatGPTを使ったデータ分析事例(A/Bテストの効果検証)はいかがでしたか? このように、初学者でも手軽にデータ分析に取り組めるようになったのは非常に画期的なことといえます。
ただし、これまで他のDXpedia記事でもお伝えしてきたとおり、ChatGPTの回答はすべて正しいとは限らないのでご注意ください。精度は高くとも、誤った回答をもっともらしく出力することがあります。すべてをChatGPT任せにはせず、必ず出力結果の正当性をチェックしましょう。
無料版でも有料版でも!ChatGPTを使おう③~使用時の注意点5選
そのためには、やはり自分自身で統計学やプログラミングの知識を身につけることが大切です。また、ChatGPTから良い回答を引き出すために「適切なプロンプト」を作るテクニックも重要になってきます。インソースデジタルアカデミーは、それらのスキルを身につけるのに役立つ研修を豊富にご用意しています。
ぜひ当社の研修も活用いただきながら、本格的な「データ分析」に取り組んでみてください!
※本記事は2024年07月12日現在の情報です。
おすすめ公開講座
関連ページ
統計学、Python、Microsoft Excelの研修を通じて、ビッグデータの解析とデータサイエンスに必要な思考スキルを習得。それぞれの研修で専門知識を深め、ビジネスに生かすことができます。
似たテーマの記事
2024 AUTUMN
DXpedia® 冊子版 Vol.2
Vol.1の「ChatGPT時代」に引き続き、「サイバーセキュリティの今」をテーマにMS&ADインターリスク総研株式会社との対談など、近年注目が集まるセキュリティ問題についてご紹介しております。
Index
-
PICKUP
【巻頭対談】サイバー攻撃への備え 従業員教育が欠かせない
-
冊子限定
「復旧まで1カ月以上」が2割〜国内のランサムウェア被害調査
-
PICKUP
サイバーセキュリティ今昔物語
-
冊子限定
DXpediaⓇ人気記事
-
冊子限定
【コラム】白山から宇宙へ~アポロが生んだ技術の大変革
2024 SUMMER
DXpedia® 冊子版 Vol.1
「ChatGPT時代」をテーマにDXpedia®で人気の記事を冊子にまとめました。プロンプト例を交えた解説や、様々な場面での活用法をご紹介しています。生成系AIの特性を正しく理解し、ひとりの優秀な部下にしましょう。
Index
-
冊子限定
プロンプトでAIをあやつる~前提や体裁を正しく指示して完成度UP!
-
冊子限定
AIそれはデキる部下~インソースグループの生成系AI研修
-
冊子限定
AIと作る表紙デザイン~生成系AIを有能なアシスタントにしよう
-
冊子限定
【コラム】白山から宇宙へ~未来を切り拓くSX(
-
冊子限定
DXpediaⓇ人気記事
2023 AUTUMN
Vol.12 今日からはじめるDX
Vol.12は「中堅・成長企業でのDXの進め方」がテーマです。他社リソースを上手に活用するために身につけたい「要求定義と要件定義」を解説しました。 2人の「プロの目」によるDXの取組みへのヒントに加え、身近なアプリではじめるDXを活用事例とともに紹介します。DXお悩みQ&Aでは、中小・成長企業特有の事例を取り上げました。DXをはじめるなら「今」です。
Index
2023 SPRING
Vol.11 DX革命 第二章~着手から実践へ
vol.4の続刊であるVol.11は「DX革命の実践」がテーマです。 本誌の前半ではDXの課題を4段階に整理し、各段階の解決策である研修プランを掲載しています。 後半では弊社が研修を通じてDXを支援した、各企業様の事例と成果を紹介しています。自社のDX実践に際して、何がしかの気づきを得られる内容となっています。
Index
2020 WINTER
Vol.04 DX革命
Vol.04はDX推進のための効果的な手法がテーマです。DXは喫緊の経営課題である一方、IT人材不足や高いシステム導入コストにより実現が難しいと捉えられがちです。そこで本誌では、今いる人材で低コストに推進するDXについてご紹介しております。
Index
お問合せ
まずはお電話かメールにてお気軽にご相談ください
お電話でのお問合せ
03-5577-3203