PLS-DA/OPLS-DA二次元図

主成分分析（PCA）法とは異なり、Partial Least Squares Discrimination Analysis（PLS-DA）やOrthogonal PLS-DA（OPLS-DA）は、監視された判別分析の統計方法です。この方法は、PLS-DAを使用して代謝物の発現量とサンプルカテゴリー間の関係モデルを構築し、サンプルカテゴリーの予測を実現します。各ペアで比較するPLS-DAモデル（図1）またはOPLS-DAモデル（図2）を構築し、得られたモデルのパラメーター評価は表形式で提供されます。R^2XとR^2Yはそれぞれ、構築されたモデルがXとYマトリックスをどの程度説明しているかを示し、Q2はモデルの予測能力を示します。理論的には、R^2、Q^2の値が1に近いほどモデルが良好で、低いほどモデルの適合精度が低いことを示します。一般的には、R^2、Q^2が0.5（50％）以上であれば良好で、0.4以上であれば許容されます。また、両者の差が大きくないことが重要です。特に臨床サンプルは個体差が大きく、制御不能であるため、大規模サンプルではR^2、Q^2が0.2程度であっても許容されます。図3はPLS-DAモデル（c）の検証であり、直線の傾きが大きく、Q^2の切片がXであることは、PLS-DAモデルが過適合していないことを示しています。また、変数投影重要度（Variable Importance for the Projection, VIP）を計算し、各代謝物の発現パターンが各グループのサンプル分類判別に与える影響の強さと説明能力を測定し、バイオマーカー代謝物のスクリーニングを支援します（通常、VIP値>1.0をスクリーニング基準とする）（図4）。