データサイエンティストとは、統計学と情報学の知識だけではなく、それらのスキルを実際に使いこなし、現場の問題を解決できる体系的能力を持つ者である。データサイエンティストとして働くためには、問題を設定し、問題を解決するために必要なデータを定め、データを収集し、分析結果を理解し、その分析結果の確認及び活用できること(PPDACサイクル)が必要である。本授業では、グループワークでデータの分析を行い、発表する。
|
|
|
データサイエンスについての理解を深め、PPDACサイクルにおける一連の流れ「計画→データ収集・加工・分析→分析結果の確認→結果の解釈・問題解決策の提案(価値創造)」を理解する。
|
|
|
1. PPDACサイクル(1) *全クラス合同 2. PPDACサイクル(2) *全クラス合同 3. グループワーク・分析のアイディア出し 4. Excel基本操作・セルの演算/要約統計量の計算+グループワーク 5. Excelヒストグラムの作り方/相関と回帰+グループワーク 6. Excel信頼区間+グループワーク 7. Excelロジスティック回帰+グループワーク 8. (クラス内)中間発表 9. グループワーク 10. グループワーク 11. グループワーク 12. グループワーク 13. グループワーク 14. (クラス内)最終発表 15. 全体発表
|
|
|
事前学習:講義開始までに、参考書などによりデータサイエンスの基礎について学習する 事後学習: 中間発表・最終発表に必要な資料を授業時間外にグループで集まって作成する
|
|
|
授業参加(70%)と最終レポート(30%)で総合的に判断する。データの分析を自分の視点で行い、発表としてまとめられれば合格とする。
|
|
|
最終レポートは適切な分析手法を使い、PPDACサイクルに従ったわかりやすいプレゼンになっているかどうかを見る。
|
|
|
|
|
978478060701
|
|
データサイエンス入門 第2版
|
|
竹村彰通, 姫野哲人, 高田聖治 編,竹村, 彰通, 1952-,姫野, 哲人,高田, 聖治, 1965-,
|
|
学術図書出版社
|
|
2021
|
|
|
|
|
|
|
|
|
|
|
|
「データサイエンスへの招待」に相当する内容を習得していることが前提である。グループワークでExcelやPowerPointを利用するので、操作に習熟していることが必要である。
|
|
|
|
|
|