Pipeline Pilot Advanced Modeling Collection
Advanced Modeling Collection は、再帰的分割 (Recursive Partitioning) およびパレート最適化のための手法のほか、遺伝的アルゴリズムを応用した Genetic Function Approximation (GFA) を用いた QSAR 分析のための手法を提供します。
- Recursive Partitioning コンポーネントは、シングルツリーやフォレストツリーなど、さまざまな再帰的分割手法を提供します。これらの手法は、単一または複数の変数を学習できます。
- Pareto Optimization コンポーネントは、パレート最適化問題のための手法を提供し、相反する 2 つ以上の変数間でトレードオフの判断基準を含むソリューションを提供します。
- Genetic Function Approximation (GFA) は、遺伝的アルゴリズム法を応用して QSAR を計算します。これにより、化合物のプロパティ間の重要な関係を特定します。
Recursive Partitioning コンポーネントによって、次のことを実現できます。
- 多数の記述子を持つ膨大なデータ セットに対して高速な学習/データ マイニング
- 記述子としてフィンガープリントを使用して化合物データセットを学習
- ツリーの視覚化によって記述子と分類の関係を理解
- 記述子の使用を分析して最も特異的な記述子を特定
- ハイスピードで新しいデータセットのモデル値を予測
Pareto Optimization コンポーネントによって、次のことを実現できます。
- コンビナトリアル・ ライブラリ設計、製剤成分の最適化、株式ポートフォリオのリスク管理など、多岐にわたる問題に対するソリューションを最適化
- データセットから望まれる物性値の最良のトレードオフを持つサンプルを抽出
- 大きなデータ セットから目的の物性値間で最良のトレードオフを持つサンプル・サブセットを抽出
GFA 分析によって、次のことを実現できます。
- ベストモデルだけでなく多数の試行モデルを作成
- トレーニングデータにある偽相関を意図的に追加
- この技法を利用して仮説のテストではなく仮説を作成