1. トップページ
  2. DXコラム
  3. 今日から使える「データサイエンス」の技法3種をデータサイエンティストがご紹介!

2023.07.10ページが新しくなりました!

いつもDXコラムをご覧いただき、誠にありがとうございます。

DXコラムは、DX/ITに関する情報をあらゆる切り口から詳しくご説明したオウンドメディア「DXpediaⓇ(DXコラム後継)」としてリニューアルいたしました。

各分野で経験を積んだテキスト作成者が語る記事や、最新のDX動向を掴める記事などを取り揃えております。IT業界の方だけでなく、すべてのビジネスパーソンに読んで欲しい記事がここにあります。

今日から使える「データサイエンス」の技法3種をデータサイエンティストがご紹介!

 AI研修のまとめページはこちら
https://www.insource.co.jp/gyokai/ai_top.html


データサイエンティスト協会では、データサイエンティストに必要な3つのスキルを
「ビジネス力」「データエンジニアリング力」「データサイエンス力」と定めています。


出所:データサイエンティスト協会「2019年度スキル定義委員会活動報告」
http://www.datascientist.or.jp/symp/2019/pdf/1115-1155_skill.pdf


今回は「データサイエンス力」に焦点を当てていきます。
「データサイエンス力」は統計学や機械学習の知見を用いて、実際にデータ分析を
行うスキルです。
料理で例えるなら、下ごしらえした食材を炒めたり、茹でたりする調理方法をイメージ
すると分かりやすいでしょう。
「データエンジニアリング力」で下準備したデータを様々な方法で実際に分析するの
が「データサイエンス力」
です。

それでは、実際に使われているデータサイエンスの技法を見ていきましょう!
代表的な技法の中から3つご紹介いたします。


ア.線形回帰
予測を行いたい時にシンプルで使いやすい分析方法です。
例えば、運動はストレスにいいと仮説を立て、「1週間あたりの運動時間からストレス
を予測したい」とします。
データから1週間あたりの運動時間とストレスの関係を直線で表して数式に当ては
めるのが線形回帰です(例1)。

▽例1:線形回帰イメージ

※株式会社インソースデジタルアカデミーが架空のデータを作成

線形回帰ではある要素(1週間あたりの運動時間)が調べたい要素(ストレス)に
どのように影響するかを分析できます。
また、数式に当てはまることにより予測を行うことも可能です。


イ.ロジスティック回帰
分類を行うときによく使う分析方法です。
例えば、「資格の模擬試験の点数と残業時間から資格試験に合格するかどうか」の
分類を行いたいとします。
これまでに得られたデータから、まだ資格試験を受けていない人の合否見込みを判
定できるのがロジスティック回帰です(例2)。

▽例2:ロジスティック回帰イメージ

※株式会社インソースデジタルアカデミーが架空のデータを作成

ロジスティック回帰を使うと、Jさんの資格試験の合否見込みをこれまでのデータから
判定することが可能です。
線形回帰とは違い、調べたい要素(資格試験の合否)が数量で表せない時に
使うことが多いです。


ウ.クラスター分析
集団の中から似ているもの同士をグループ分けしたい時に使う分析手法です。
例えば、ショートケーキ、シュークリーム、どら焼き、白玉ぜんざい、みかんゼリー、
マンゴープリンの6種類のスイーツがあり、好みのアンケートを取ったとします。
スイーツの好みの傾向を、仮に3つのグループに分けるとしたらどうなることが考え
られるでしょうか。

(1)ショートケーキやシュークリームのようなクリーム系が好みのグループ
(2)どら焼きや白玉ぜんざいのような餡子系が好みのグループ
(3)みかんゼリーやマンゴープリンのようなフルーツ系が好みのグループ

一例ですが、このように分けられることが考えられます(例3)。
これを統計学に用いてグループ分けをするのがクラスター分析です。

▽例3:クラスター分析イメージ

※株式会社インソースデジタルアカデミーが作成

クラスター分析ではデータ全体を類似性に基づいて特徴を分析します。
ECサイトで活用されているレコメンドシステムではクラスター分析が使われており、
利用者の好みを分析してオススメする商品を決めています。

今回は、データサイエンスで使われる主な技法を3つ紹介しましたがいかがだった
でしょうか。
データサイエンスではこれらの分析方法を用いて予測や分類などを行っています。
ぜひ皆さまも現場で活用いただき、ビジネスをより良いものとしていっていただけ
れば幸いです。


【最新作】データ活用の促進に繋がるデータサイエンティスト育成コースはこちら
https://www.insource.co.jp/bup/it_data-scientist.html

【PR】ITエンジニア向け新作研修ができました!
エンジニア向けIT研修講師育成研修
https://www.insource.co.jp/bup/bup-ee-instructor-training.html
新入社員向けITエンジニア研修
~組込みエンジニア養成 2ヶ月コース(モノづくりの基礎を学ぶ38日間)
https://www.insource.co.jp/set/kenshu-it-built-in-engineer.html


※本記事は2021年10月20日現在の情報です。
  

2024 AUTUMN

DXpedia® 冊子版 Vol.2

Vol.1の「ChatGPT時代」に引き続き、「サイバーセキュリティの今」をテーマにMS&ADインターリスク総研株式会社との対談など、近年注目が集まるセキュリティ問題についてご紹介しております。

Index

2024 SUMMER

DXpedia® 冊子版 Vol.1

「ChatGPT時代」をテーマにDXpedia®で人気の記事を冊子にまとめました。プロンプト例を交えた解説や、様々な場面での活用法をご紹介しています。生成系AIの特性を正しく理解し、ひとりの優秀な部下にしましょう。

Index

  • 冊子限定

    プロンプトでAIをあやつる~前提や体裁を正しく指示して完成度UP!

  • 冊子限定

    AIそれはデキる部下~インソースグループの生成系AI研修

  • 冊子限定

    AIと作る表紙デザイン~生成系AIを有能なアシスタントにしよう

  • 冊子限定

    【コラム】白山から宇宙へ~未来を切り拓くSX(

  • 冊子限定

    DXpediaⓇ人気記事

2023 AUTUMN

Vol.12 今日からはじめるDX

Vol.12は「中堅・成長企業でのDXの進め方」がテーマです。他社リソースを上手に活用するために身につけたい「要求定義と要件定義」を解説しました。 2人の「プロの目」によるDXの取組みへのヒントに加え、身近なアプリではじめるDXを活用事例とともに紹介します。DXお悩みQ&Aでは、中小・成長企業特有の事例を取り上げました。DXをはじめるなら「今」です。

Index

2023 SPRING

Vol.11 DX革命 第二章~着手から実践へ

vol.4の続刊であるVol.11は「DX革命の実践」がテーマです。 本誌の前半ではDXの課題を4段階に整理し、各段階の解決策である研修プランを掲載しています。 後半では弊社が研修を通じてDXを支援した、各企業様の事例と成果を紹介しています。自社のDX実践に際して、何がしかの気づきを得られる内容となっています。

Index

2020 WINTER

Vol.04 DX革命

Vol.04はDX推進のための効果的な手法がテーマです。DXは喫緊の経営課題である一方、IT人材不足や高いシステム導入コストにより実現が難しいと捉えられがちです。そこで本誌では、今いる人材で低コストに推進するDXについてご紹介しております。

Index

  

お問合せ

まずはお電話かメールにてお気軽にご相談ください

お電話でのお問合せ

03-5577-3203

PAGE TOP