主成分分析(PCA)法とは異なり、Partial Least Squares Discrimination Analysis(PLS-DA)やOrthogonal PLS-DA(OPLS-DA)は、監視された判別分析の統計方法です。この方法は、PLS-DAを使用して代謝物の発現量とサンプルカテゴリー間の関係モデルを構築し、サンプルカテゴリーの予測を実現します。各ペアで比較するPLS-DAモデル(図1)またはOPLS-DAモデル(図2)を構築し、得られたモデルのパラメーター評価は表形式で提供されます。R^2XとR^2Yはそれぞれ、構築されたモデルがXとYマトリックスをどの程度説明しているかを示し、Q2はモデルの予測能力を示します。理論的には、R^2、Q^2の値が1に近いほどモデルが良好で、低いほどモデルの適合精度が低いことを示します。一般的には、R^2、Q^2が0.5(50%)以上であれば良好で、0.4以上であれば許容されます。また、両者の差が大きくないことが重要です。特に臨床サンプルは個体差が大きく、制御不能であるため、大規模サンプルではR^2、Q^2が0.2程度であっても許容されます。図3はPLS-DAモデル(c)の検証であり、直線の傾きが大きく、Q^2の切片がXであることは、PLS-DAモデルが過適合していないことを示しています。また、変数投影重要度(Variable Importance for the Projection, VIP)を計算し、各代謝物の発現パターンが各グループのサンプル分類判別に与える影響の強さと説明能力を測定し、バイオマーカー代謝物のスクリーニングを支援します(通常、VIP値>1.0をスクリーニング基準とする)(図4)。