科目責任者 | 稻岡 秀検 |
---|---|
担当者 | 稻岡 秀検※ |
科目概要 | 2年 (2単位・選択) [リハビリテーション学科 理学療法学専攻] 2年 (2単位・選択) [リハビリテーション学科 作業療法学専攻] |
現在、遺伝子発現データやタンパク質相互作用などマルチオミックスデータが集積され解析されている。このようないわゆるビッグデータの解析には、数理モデル・統計モデルといった統計技術や、機械学習の技術が利活用されている。本講義では前半にこられの統計モデルや、機械学習の技法などのデータサイエンスを支える基盤技術について簡単に紹介し、それがヘルスケアなどを含む各分野でどのように利活用されているかについて解説する。
後半では、これらの統計・機械学習のツールとして広く活用されているPython開発環境を通してコンピュータプログラミングの基本について理解し、実用的なデータ処理プログラムが書けるようになることを目標とする。
この科目は学位授与方針(ディプロマ・ポリシー)の(PT)②③⑤,(OT)①に関連する。
【教育内容】
以下のプログラミングの基本技術について、1人コンピュータ1台を使った演習方式で学習する。
1. データサイエンス技術について概説する。
2. 演習で使用するプログラミング言語はPythonとする。
3. 最初に配列、ループ、リストの操作について学ぶ。作成したデータをファイルへ入出力する手法、データの可視化について学ぶ。
4. 時系列データ処理の基本となるフーリエ級数展開、フーリエ変換について学ぶ。
5. 最後に統計的なデータ処理の基礎について学ぶ。
【教育方法】
授業形態:講義
パワーポイントを用いた講義を行い、講義中にPCを用いたプログラミング演習を行う。
【フィードバック】
演習終了後に、データ分析に必要なアルゴリズムについて解説し,模範解答として実装されたソースファイルを示し、動作について解説を行う。
回 | 項目 | 授業内容 | 担当者 | 日時 |
---|---|---|---|---|
第1回 | 【対面】統計モデル・機械学習の概要の紹介、Pythonの基礎 | 現在の社会では複雑・膨大なデータがインターネット等から入手可能となっている。マルチオミックスデータ(ビッグデータ)に代表されるヘルスケアデータを解析する上で、統計モデル・機械学習などが利活用されている。そこで統計モデル・機械学習の概要について紹介し、これらの技術がヘルスケア分野などでどのように活用されているかについて概説する。次いで、統計処理などで多様されるプログラミング言語について学ぶために、Pythonプログラミングの基本について説明する。 | 稻岡 秀検 | 4/10③ |
第2回 | 【対面】回帰分析の概要の紹介・多重配列 | 統計的解析の具体例として、天候とジュースの売上の回帰分析について解説する。回帰分析の基礎として、単回帰・重回帰について解説し、その具体的な応用例について解説する。ついで回帰分析に必要なプログラミング技術としてのデータ配列について解説し、具体例としてPython・NumPyによる二次元配列について説明する。さらにループを用いた配列操作について説明し、行列の演算、連立方程式の解法について説明する。 | 稻岡 秀検 | 4/17③ |
第3回 | 【対面】記述統計の概要の紹介・連結リスト | 具体的なデータ分析例として記述統計について概説する。その後データの連結などに利用される再帰の概念について説明し、具体例として単方向リスト、双方向リスト、循環リスト、双方向循環リストについて説明する。 | 稻岡 秀検 | 4/24③ |
第4回 | 【対面】深層学習の概要の紹介・連結リストの応用 | AI最新技術の活用例として深層生成モデル、強化学習、転移学習などについて概説する。深層学習で用いられるニューラルネットを説明するために、まず連結リストを応用したニューロンを模擬するアルゴリズムを説明する。その後、ニューラルネットワークを用いて排他的論理和を学習するモデルを実装する。 | 稻岡 秀検 | 5/8③ |
第5回 | 【対面】次世代医療基盤法の紹介・ファイル入出力 | 次世代医療基盤法による加工データや、人の行動ログデータから得られる日常生活のデータなどのヘルスケアデータの利用法について概説する。その後、実際にプログラムで大規模データを取り扱うための具体例として、pandasによるファイルの入出力の方法について説明する。 | 稻岡 秀検 | 5/15③ |
第6回 | 【対面】データ利活用のための技術の概説・データの可視化 | データのグルーピング、パターン発見のための技術について概説する。その後、具体例としてMatplotlibを用いたデータの可視化手法について説明する。 | 稻岡 秀検 | 5/22③ |
第7回 | 【対面】フーリエ級数展開 | 関数の級数展開、関数の直交性について学ぶ。実際にPythonでフーリエ級数部分和を調べ、フーリエ級数展開について理解する。 | 稻岡 秀検 | 5/29③ |
第8回 | 【対面】フーリエ変換 | 複素フーリエ級数、振幅スペクトル、パワースペクトル、位相スペクトルについて学ぶ。フーリエ変換、フーリエ逆変換について学ぶ。 | 稻岡 秀検 | 6/5③ |
第9回 | 【対面】高速フーリエ変換 | サンプリング定理について学び、高速フーリエ変換のアルゴリズムについて学ぶ。実際にPythonで周波数情報を取り出す事例について学び、FFTを実装する。 | 稻岡 秀検 | 6/12③ |
第10回 | 【対面】記述統計・1変量データ | 平均値、標本分散、不偏分散、標準偏差について学ぶ。 | 稻岡 秀検 | 6/19③ |
第11回 | 【対面】記述統計・多変量データ | クロス集計表、共分散、分散共分散行列、ピアソンの積率相関係数について学ぶ。 | 稻岡 秀検 | 6/19④ |
第12回 | 【対面】点推定・区間推定 | 点推定、区間推定、信頼区間について学ぶ。 | 稻岡 秀検 | 6/26③ |
第13回 | 【対面】仮説検定 | t検定、有意差、帰無仮説、対立仮説、片側検定、両側検定、p値の概要と計算法について学ぶ。 | 稻岡 秀検 | 6/26④ |
第14回 | 【対面】平均値の差の検定 | 対応のあるt検定、対応の無いt検定について具体的に学ぶ。 | 稻岡 秀検 | 7/3③ |
第15回 | 【対面】分割表の検定 | 期待度数、分割表の検定について具体的に学ぶ。また、検定の結果の解釈について理解する。 | 稻岡 秀検 | 7/10① |
◆実務経験の授業への活用方法◆
研究所での経験を踏まえ、測定したデータをプログラムで取り扱うための汎用的なデータの読み込みアルゴリズムを解説し、次いでフーリエ変換や統計的なデータ処理などの実用的なデータ処理方法を実際のデータ処理を行いながら利用法について概説する。
受講人数によっては、演習室内の人数を制限する必要がある。そのため、対面講義とオンデマンド講義を併用する可能性がある。
1. 統計モデル・機械学習の概要について説明できる。
2. 二次元配列データを操作できる。
3. 連結リストを理解し、連結リストを応用したプログラムを作成できる。
4. ファイルの入出力の方法について説明できる。
5. データの可視化の方法について説明できる。
6. フーリエ変換について説明できる。
7. 高速フーリエ変換を用いて、実際にデータを処理できる。
8. 基本統計量について説明できる。
9. 点推定、区間推定について説明できる。
10. 仮説検定について説明できる。
11. 平均値の差について実際に検定し、評価できる。
12. 分割表について実際に検定し、評価できる。
講義中の課題(20%)、レポート(80%)により評価する。
【授業時間外に必要な学習時間:60時間】
予習
講義中の演習問題について、教科書等を利用して復習すること。
復習
講義中の課題について、プログラムの構文の意味を理解しておくこと。
種別 | 書名 | 著者・編者 | 発行所 |
---|---|---|---|
教科書 | 資料を配付する。 | ||
参考書 | Pythonによるアルゴリズムとデータ構造の基礎 | 永田武 | コロナ社 |
参考書 | Pythonによるデータ分析入門 第2版 | Wes McKinney | オライリー・ジャパン |
参考書 | Pythonで学ぶフーリエ解析と信号処理 | 神永正博 | コロナ社 |
参考書 | Pythonで学ぶあたらしい統計学の教科書 | 馬場真哉 | 翔泳社 |
科目ナンバリングコード: (PT)PT201-SF23, (OT)OT201-SF25