データサイエンティストとは、統計学と情報学の知識だけではなく、それらのスキルを実際に使いこなし、現場の問題を解決できる体系的能力を持つ者である。データサイエンティストとして働くためには、問題を設定し、問題を解決するために必要なデータを定め、データを収集し、分析結果を理解し、その分析結果の確認及び活用できること(PPDACサイクル)が必要である。本授業では、グループワークでデータの分析を行い、発表する。
この科目はデータ駆動型PBL演習科目の最初の科目であり、「データサイエンス入門」「基礎データ分析」で学んだデータサイエンスに関する基礎知識、「プレゼンテーション論」で学んだプレゼンテーション方法内容を実データを用いて実践する科目である。また、ここで学んだ内容は「データサイエンス応用演習」等次年度以降の内容につながるものである。
|
|
|
データサイエンスについての理解を深め、PPDACサイクルにおける一連の流れ「問題設定→計画→データ収集→加工・分析→結果の解釈・問題解決策の提案(価値創造)」を理解し、実行する。
ディプロマポリシーの「多様なコミュニケーションの力量を備え、データ利活用の現場で相互補完的な専門性を有する仲間と協力して、組織目標を追求できる。」が当てはまる。
|
|
|
第1回
|
PPDACサイクル(1) *全クラス合同
|
第2回
|
PPDACサイクル(2) *全クラス合同
|
第3回
|
グループワーク・分析のアイディア出し
|
第4回
|
Excel基本操作・セルの演算/要約統計量の計算+グループワーク
|
第5回
|
Excelヒストグラムの作り方/相関と回帰+グループワーク
|
第6回
|
Excel信頼区間+グループワーク
|
第7回
|
Excelロジスティック回帰+グループワーク
|
第8回
|
(クラス内)中間発表
|
第9回
|
グループワーク
|
第10回
|
グループワーク
|
第11回
|
グループワーク
|
第12回
|
グループワーク
|
第13回
|
グループワーク
|
第14回
|
(クラス内)最終発表
|
第15回
|
全体発表
|
|
|
|
|
中間発表・最終発表に必要な資料を授業時間外にグループで集まって作成する。
最初の2回については座学中心であり、事前・事後学習に1時間程度の学習時間が必要である。 3回目以降はグループワーク中心であり、授業時間だけでは十分な分析はできない。そのため、授業時間外に2~3時間の時間を割いて分析・議論・資料作成に充てる必要がある。
|
|
|
授業参加(70%)と最終レポート(30%)で総合的に判断する。グループワークに積極的に参加し、データの分析を自分の視点で行い、発表・レポートとしてまとめられれば合格とする。
|
|
|
授業参加(70%)では単に出席するだけでなく、グループ内での発言や活動などグループ活動に対してどこ程度寄与しているかに基づいて評価を行う。各回において一定の寄与があればその回の点数を満点とする。
最終レポート(30%)は適切な分析手法を使い、PPDACサイクルに従ったわかりやすいプレゼンになっているかどうかを見る。 本科目はグループワーク中心であるが、最終レポートには学生独自の分析を加えたものを提出する。 「秀」:PPDACサイクルに沿った分析ができており、高度かつ独創的な分析内容を含むもの 「優」:PPDACサイクルに沿った分析ができており、高度ではないものの独創的な分析内容を含むもの 「良」:PPDACサイクルに沿った分析ができており、独自の分析内容を含むもの 「可」:PPDACサイクルに沿った分析ができているもの 「不可」:PPDACサイクルに沿った分析できていないもの
|
|
|
|
|
|
|
|
|
|
|