特許テキストマイニング
English  中文  台灣  한글  Deutsch  Français  Sueco  Finlandês  Italiano  Español  Português  हिन्दी  Russian  עברית  Arabic
  1. 特許テキストマイニング
  2. 特許テキストマイニング
特許テキストマイニング機能の基本的な画面構成は下図となります。基本的な使い方としては左側にプロットされた特許検索結果の母集団を回転させながら平面的、時系列的に俯瞰しつつ特許群を分析することができます。特許検索母集団はテキストマイニングにより特許の文献内容が近い特許ほど近くにプロットされるように描画されます。 テキストマイニング機能 概要図

これまで100件〜300件程度の本検索結果(いわゆる要精査特許)は特許出願日・特許公開日順に一件ずつ見て行かなければならず特許検索結果を俯瞰・分析するには経験をもっている人でも大変手間と時間のかかる作業でした。特に、特許閲覧途中に「前に似たような特許文献を読んだなぁ...」といった場合は、それまでに読んだ特許を再度読み直して、似た特許文献を探し出して、類似特許間の関連性・相違点を比較しながら読み進める必要があり単純な新規性調査ならまだしも、高々300件程度の文献であっても他社の技術や出願動向を把握する場合には非常に手間がかかっていました。

  • パテント・インテグレーションはテキストマイニングを特許へ応用し、数百件程度の特許文献をテキストマイニング技術に基づき可視化することにより特許検索結果母集団の全体像把握を支援します。類似文書を平面にプロットするとともに、奥行き(Z軸方向)として特許出願日順に各特許文献をプロットします。特許テキストマイニング機能を使うことにより下記のメリットがあります
    • 類似特許毎(クラスタ毎)に読み進めることにより、精査作業が捗ります。
    • 類似特許を時系列(特許出願日順)に並べ、比較し読み進めることにより対象とする類似特許の相違点・発展が非常に明確なものとなり、品質の高い特許調査を行うことができます。
  • 特許テキストマイニング技術を活用することにより、類似文書毎にしおり設定などをすることによりノイズを簡単に除去することができます。

特許テキストマイニング機能の利用方法

特許テキストマイニング機能は、特許検索結果コントロールのMENUから「可視化」を選択することにより利用することができます。

特許テキストマイニング機能

文献の分布状況の確認

文献の分布状況は、上、左に配置されたスライダーを移動させることにより三次元的(奥行きは出願日順にプロットしています)に把握することができます。

特許テキストマイニング機能

各点は1特許文献に対応しており、マウスを載せることにより特許文献の概要を確認することができます。このとき表示される内容は、

  • しおり:しおりが設定されている場合は左上にアイコンが表示されます。ゴールドは候補、シルバーは次候補、×は除外、アイコンがないときはしおりが設定されていないことを示します。
  • 発明の名称
  • 出願日
  • 公開日
  • 出願人
  • 発明者
  • 関連語:類似度を算出するときに用いた単語のうち、テキストマイニングによる特許分析の結果、特にこの特許文献と関連性の強い上位単語を表示しています。後述するコントロール機能により関連語が含まれる特許文献を母集団から簡単に発見することができます。特許テキストマイニング機能は、この関連語が近い文献ほど近くに配置される傾向があります。
特許テキストマイニングによる関連語

特許文献のクラスタ

各特許文献はテキストマイニング技術による計算の結果「文書内容が類似する特許文献」ほど近くに配置されますが、パテント・インテグレーションの計算する特許文献の単語空間の次元は時には数万次元にも及ぶため適切に平面(二次元)にプロットできない場合がしばしばあります。パテント・インテグレーションは数万次元空間における二つの特許の類似度(距離)に応じて特許群毎に特許をクラスタリング(自動分類)する機能を備えています。各クラスタには自由に色を割り当てることが可能です。例えば、殆ど同じ観点のクラスタには同じ色を配色することにより作業効率が高めることができます。

また、チェックボックスをはずすことにより点を消すことができます。不要な点を消去することにより、注目したクラスタの解析がしやすくなります。

特許テキストマイニング機能チェックボックスの設定

クラスタリング情報も考慮することにより、高次元空間においてテキストマイニング技術により計算された特許文献の類似度の理解を助けます。例えば、下図の例をとりあげてみましょう。今回、マウスにより選択されている「特開2003-237117」は紫の点(クラスタ番号5)に囲まれていますが色は黄色です。これは、この特許文献が平面にプロットされるときに紫の点に囲まれているものの、元々の高次元空間においては黄色のクラスタ(クラスタ番号4)の方により近い特許であることを示します。

クラスタ数は、特許文献に含まれる観点の度合いに応じて自動的に算出します。多様な観点が含まれている特許検索結果母集団ほぼ多くのクラスタに分類されます。

特許テキストマイニングによるクラスタリング

しおりの特許文献への設定

特許テキストマイニング機能ではクラスタ毎、特許出願人毎、特許発明者毎にしおりをまとめて設定することができます。しおりの設定は、コントロールパネルに列挙されたコンボボックスを操作することにより設定することができます。例えば、クラスタ6に「候補」しおりを設定してみましょう。

しおりの特許文献への設定

しおりが設定されました。

しおりの特許文献への設定

しおりを設定することにより、「一覧表示機能」などから「候補」しおりを設定した特許文献を一覧することができます。また、「母集団生成」を押すことによりしおりが設定された特許文献のみの母集団を新たに生成することが簡単に行えます。これを利用することにより、特許検索時に関連性の低い特許文献のスクリーニング(ノイズ除去)を行ったり、関連性の高い特許文献のみピックアップしたりすることができます。

しおりの特許文献への設定

また、しおりが付された特許文献の特許分類の付与状況を「特許分類 表」で一覧することができます。この機能を使うことにより、例えば特許予備検索結果から簡単に検索対象の特許分類を特定することができます。また、特定した特許分類を特許分類ブックマークへ登録することにより、本検索の検索式を組み立てるときに参考になります。

特許分類表による特許分類付与状況の確認
特許分類表による特許分類付与状況の確認

複数の特許文献に対しまとめて処理を適用する

テキストマイニング機能によりプロットされた各特許文献から、複数の特許文献を簡単にまとめて選択し、しおり、レーティングおよびブックマークなどの属性情報をまとめて設定したり、一括閲覧や特許ダウンロードをすることもできます。

複数の特許文献は「シフトキーを押したままマウスによりドラッグ&ドロップ」をすることにより、まとめて選択することができます。また、上部の「解除」ボタンをクリックすることにより、すべての選択状態を解除することができます。解除ボタンには、選択されている特許文献の個数が併せて表示されます。例えば、次ぎの例では7件の特許文献が選択されています。

シフトキー+ドラッグ&ドロップにより複数の特許文献を選択できます

また、「シフトキーを押したままマウスでクリック」することにより、特許文献を個別に選択することもできます。

シフトキー+クリックによっても特許文献を選択することができます

また、選択状態にある特許文献を再度「シフトキーを押したままマウスでクリック」することによっても特許文献の選択を解除することができます。全ての選択を解除するには、上部に配置された「解除」ボタンをクリックします。

シフトキー+クリックにより選択を解除することもできます

選択された特許文献は輪郭線が太く表示されます。

画面上の適当な位置で右クリックすると、選択された特許文献へまとめて適用できる処理の一覧がメニュー表示されます。具体的には、選択された特許文献のみをまとめて一括閲覧特許閲覧でまとめて閲覧したり、特許ダウンロードにより各種フォーマットで保存したり、レーティング、ブックマークやしおりをまとめて設定することができます。

右クリックによりメニューが表示されます

この機能を利用することにより、例えば、選択された特許文献のみ一括閲覧することができます。

選択された特許文献のみ一括閲覧します
【参考】