このサイトではJavaScriptを使用しています。ブラウザの設定でJavaScriptを有効にしてからお使いください。 テキストマイニングとAI・機械学習による効率的な特許調査 [講習会詳細] | テックデザイン
※お申込前に「注意事項」をご確認ください

テキストマイニングとオープンソースを用いたAI・機械学習の特許調査への応用を、事例とデモを交え解説します。さらに、自分でできる特許情報解析ツールも紹介しますので、プログラムやサンプルデータを実際にお試しいただくことができます。特許調査の効率化を図りたい方にお勧めです。

 

テキストマイニングと
AI・機械学習による効率的な特許調査

 

テキストマイニング活用事例/先行技術・技術動向調査/特許情報解析/生成AI(ChatGPT等)の活用

コード tds20250226h1
ジャンル 知財
形式 オンラインセミナー(Live配信)
日程/時間 2025年 2月 26日(水) 13:00~17:00
配信について 見逃し配信もあります(視聴期間は10日程度)
資料(テキスト) 電子ファイルをダウンロード
ご案内事項 本講座は3/12講座【OSS(オープンソース)を使った自分でできる特許情報解析】の基礎編の位置づけとなります。実践や応用を目標とする方は同時受講がおすすめです。
2/26+3/12セット受講価格 72,600円 ⇒ 60,500円

※お申し込み時に申込プランからセット受講価格をご選択ください。
受講料
(申込プラン)

通常価格: 36,300円 (消費税込)

セット受講価格: 60,500円 (消費税込) ※12月26日までの申し込みが対象です。

 

テキストマイニングとAI・機械学習による効率的な特許調査

●講師

アジア特許情報研究会/元花王株式会社 研究開発部門 研究戦略・企画部 安藤 俊幸

1985年 現花王株式会社入社、研究開発に従事、1999年 研究所の特許調査担当(新規プロジェクト)、2009年 研究開発部門 知的財産部、2011年 アジア特許情報研究会入会、知財情報解析グループで活動、2020年 特許情報普及活動功労者表彰 日本特許情報機構理事長賞「技術研究功労者」受賞、2021年 4月より研究開発部門 研究戦略・企画部。アジア特許情報研究会、情報科学技術協会、人工知能学会、データサイエンティスト協会等に所属。ご専門は、知財情報解析、機械学習、テキストマイニング、分析化学。

●詳細

Ⅰ.はじめに
 ・講師自己紹介
 ・アジア特許情報研究会紹介

Ⅱ.特許調査とテキストマイニングの基礎
 ・調査対象と調査範囲の特定・明確化
 ・マッチングと適合
 ・特許調査における再現率(網羅性)と適合率(効率)
 ・先行技術調査と侵害防止調査の検索モデルの違い
 ・「完全一致」⇔「最良一致」検索モデルの比較
 ・検索・分類とテキストマイニングの違い
 ・テキストマイニングの基本的な仕組み

Ⅲ.テキストマイニングの概要と特許調査への応用
 ・テキストマイニングとは
 ・形態素解析と分かち書き
 ・特徴抽出(BoW,TF-IDF,BM25,単語N-gram)
 ・抽出語の頻度分析
 ・共起語のネットワーク分析
 ・ネットワーク分析の応用(発明者、引用-被引用)
 ・「文書×抽出語」行列作成と解析・可視化
 ・文書の類似度行列作成と解析/可視化

Ⅳ.各種ツールのテキストマイニング関連機能活用事例
 ・KH Coder(フリー版)の活用事例
 ・Text Mining Studio(商用)の活用事例
 ・パテントマップEXZのキーワード抽出、類似特許抽出
 ・Patentfieldの類似語、AIセマンティック検索
 ・THE調査力AI(Deskbee5)の専門用語抽出、サーチ/ノイズ確率
 ・RとPythonによるテキストマイニング
 ・生成系AI(ChatGPT)等のテキストマイニングへの応用(基礎)

Ⅴ.オープンソースを用いた機械学習の特許調査への応用
 ・機械学習の概要と特許調査への応用
 ・特許調査分野における人工知能(AI)技術の活用動向
 ・機械学習概要(分類、回帰、クラスタリング、次元圧縮)
 ・特許分野における自然言語処理導入のメリット
 ・特許調査用学習済モデルの作成とその評価方法
 ・先行技術調査の流れ(進め方)
 ・分散表現(単語埋め込み)とは
 ・分布仮説に基づいた文脈中の単語の重み学習(word2vec)
 ・doc2vecによる公報(文書)単位の類似度計算
 ・doc2vecによる発明の要素(文)単位の類似度計算

Ⅵ.AI・機械学習のクラス分類の応用事例 
 ・ディープラーニングの基礎検討
 ・文書のベクトル化検討
 ・one hotベクトル(BoW、TF-IDF等)
 ・分散表現ベクトル(word2vec、doc2vec、fastText等)
 ・機械学習による文書分類
 ・SDI調査、動向調査への応用

Ⅶ.教師無し機械学習(クラスタリング、次元圧縮)の応用
 ・単語/文書のクラスタリングによる動向調査への応用
 ・文書ベクトルの次元圧縮による特許公報の俯瞰可視化
 ・文書分類との組み合わせによるパテントマップの自動作成

【付録】 自分でできる特許情報解析ツール紹介
 1.キーワード抽出関係
  ●word2vec,doc2vecによる単語・文書の類似度計算と類似単語・文書抽出
  ●termextractによる専門用語(キーワード)自動抽出
  ●Cytoscapeによる文脈語のネットワーク分析
 2.pythonで始める機械学習
  ●python環境構築の概要
  ●doc2vecによる文書・単語の類似度計算と類似文書・単語抽出の解説

<本講座での習得事項>
 ・テキストマイニングの基礎知識と特許調査への応用のポイント
 ・機械学習による先行技術・技術動向調査の効率化

<講義概要>
 最初に特許調査とテキストマイニングの基礎について概観します。第3章ではテキストマイニングの概要と特許調査への応用について基本から応用まで段階的に述べます。第4章では、各種ツールのテキストマイニング関連機能の活用事例を紹介します。
 第5~7章では、デモを交えてオープンソースを用いた機械学習の特許調査への応用事例を、単語・文書のベクトル化、文書分類、文書ベクトルの次元圧縮による特許公報の俯瞰可視化と技術動向調査への応用を紹介します。調査目的に応じたツール・アルゴリズム・特徴量の選択が重要であり、ツールの特徴を把握して使いこなすことが大事です。また教師あり機械学習には質・量の両面で教師特許の準備が大切です。
 付録ではオープンソースを用いた、自分でできる特許情報解析ツールを紹介します。付録のプログラム、サンプルデータを実際に動かしてみることで理解が深まります。
 生成AI(ChatGPT等)を用いたテキストマイニングへの応用についても紹介します。



  • facebook

  • 食添素材ナビ
       
ページTOPへ