このサイトではJavaScriptを使用しています。ブラウザの設定でJavaScriptを有効にしてからお使いください。 製造業の問題解決に役立つ スモールデータ解析の実践手法 [講習会詳細] | テックデザイン
※お申込前に「注意事項」をご確認ください

現場で扱うことが多い「スモールデータ」をテーマに、その解析手法を学びます。限られたデータから有益な知⾒を引き出すための具体的な⽅法論を実例とともに解説し、実践的な解析スキルを習得できる内容です。

 

製造業の問題解決に役立つ スモールデータ解析の実践手法

 

コード tds20250220a1
ジャンル データサイエンス
形式 オンラインセミナー(Live配信)
日程/時間 2025年 2月 20日(木) 10:30~16:30
配信について 見逃し配信あり(視聴期間は10日程度) 当日の受講が難しい場合は見逃し配信をご利用ください
資料(テキスト) PDFデータのダウンロード
受講料
(申込プラン)

通常: 36,300円 (消費税込)

早期申込価格: 29,040円 (消費税込) ※12/20までのお申込が対象です

 

製造業の問題解決に役立つ スモールデータ解析の実践手法

●講師

名古屋大学 工学研究科 物質プロセス工学専攻 准教授 博士(工学) 藤原 幸一先生

2004年に京都大学工学部工業化学科を卒業後、2009年に博士(工学)を取得。豪Curtin大学 客員研究員を経て、2010年からNTT持ち株会社の基礎研究所で研究に従事。2012年に京都大学大学院情報学研究科 助教、2018年から名古屋大学大学院工学研究科 准教授に就任。研究分野は数理モデル、機械学習、生体信号処理、医療AI、神経科学、プロセスシステム工学など。

●詳細

Ⅰ.スモールデータとは
 1.スモールデータの特徴
 2.スモールデータ解析の現状

Ⅱ.スモールデータ解析の方法論:次元削減と回帰分析
 1.主成分分析(PCA)
  ① PCAとは
  ② 直交展開
  ③ PCAの導出
  ④ PCAと特異値分解
 2.最小二乗法
  ① 回帰分析とは
  ② 相関係数の意味
  ③ 最小二乗法の導出
  ④ 最小二乗法の幾何学的意味
  ⑤ 多重共線性の問題
 3.部分的最小二乗法(PLS)
  ① PLSとは② 潜在変数モデル
  ③ PLSモデルの導出
  ④ NIPALSアルゴリズム
  ⑤ PLSから重回帰モデルへの変換
  ⑥ クロスバリデーションによるパラメータチューニング

Ⅲ.スモールデータ解析の方法論:入力変数選択
 1.入力変数選択とは
 2.スパースモデリング
  ① スパースとは
  ② リッジ回帰
  ③ Lasso回帰
  ④ エラスティックネットモデル
  ⑤ Group Lasso
 3.変数クラスタリングによる入力変数選択
  ① スペクトラルクラスタリング
  ② NC法のコンセプト
  ③ NCSCアルゴリズムの導出
  ④ NCSCを用いた変数クラスタリングと入力変数選択
  ⑤ 製薬プロセスへの応用例

Ⅳ.スモールデータ解析の方法論:不均衡データ解析
 1.サンプリング手法
  ① サンプリング手法とは
  ② アンダーサンプリングとオーバーサンプリング
 2.ブースティング
  ① ブースティングとは
  ② AdaBoost
  ③ RandomForest
 3.ブースティングとサンプリング手法を組み合わせた不均衡データ解析
  ① 何故ブースティングとサンプリング手法を組み合わせるか
  ② RUSBoost
  ③ HUSDOS-Boost
 4.不均衡データ解析の大規模検診データへの適用例

Ⅴ.スモールデータ解析の方法論:異常検出
 1.異常検出とは
 2.多変量統計的プロセス管理(MSPC)
  ① MPSCとは
  ② T2統計量とQ統計量の幾何学的意味
 3.自己符号化器(オートエンコーダー)
 4.異常検出問題の医療データ解析への応用例

Ⅵ.スモールデータの収集・解析の考え方
 1.必要となるデータの質の問題
 2.データ収集の際の留意点
 3.スモールデータ解析の手法選択

【習得事項】
・機械学習の基礎知識
・入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
・スモールデータにおけるデータ収集の心構えの習得

【受講対象】
・現実のデータの解析に興味のある技術者・研究者(線形代数・微積.統計などの初歩の知識を前提とする)
・少量のデータから統計モデルを構築したいと考えられている方
・現場でのデータ解析に従事されている方
・現場におけるデータ収集についてお困りの方

【講演概要】
 生産現場の操業データや医療データにおいては、測定されている変数の数に比べて、統計モデリングに使用できるデータ量が限られることが多いです。通常のモデリングでは、正例・負例の両方のサンプルが必要となりますが、装置の故障など稀な事象のデータはなかなか収集が難しく、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのに大きな壁があります。このように、実世界ではしばしば必要なデータが十分に収集できず、スモールデータからどのように知識を抽出するかが重要になります。
 本セミナーでは、実例を通じて、スモールデータの解析の実態、その方法論、そしてデータ収集に関する考え方について講義いたします



  • facebook

  • 食添素材ナビ
       
ページTOPへ