Source code for nirs4all.operators.models.sklearn.plsda

"""PLS Discriminant Analysis (PLS-DA) classifier for nirs4all.

See pls.py for full documentation and usage examples.
"""
import numpy as np
from sklearn.base import BaseEstimator, ClassifierMixin
from sklearn.cross_decomposition import PLSRegression
from sklearn.preprocessing import LabelEncoder, OneHotEncoder


[docs]
class PLSDA(BaseEstimator, ClassifierMixin):
    """PLS Discriminant Analysis (PLS-DA) classifier.
    (See pls.py for full docstring)
    """

    # Explicitly declare estimator type for sklearn compatibility (e.g., StackingClassifier)
    _estimator_type = "classifier"

    def __init__(self, n_components: int = 5):
        self.n_components = n_components


[docs]
    def fit(self, X, y):
        X = np.asarray(X)
        y = np.asarray(y).ravel()
        self.n_features_in_ = X.shape[1]
        self.classes_ = np.unique(y)
        n_classes = len(self.classes_)
        if n_classes == 2:
            self.encoder_ = LabelEncoder()
            y_encoded = self.encoder_.fit_transform(y)
        else:
            self.encoder_ = OneHotEncoder(sparse_output=False, dtype=float)
            y_encoded = self.encoder_.fit_transform(y.reshape(-1, 1))
        n_comp = min(self.n_components, X.shape[1], X.shape[0] - 1)
        self.pls_ = PLSRegression(n_components=n_comp)
        self.pls_.fit(X, y_encoded)
        return self



[docs]
    def predict(self, X):
        X = np.asarray(X)
        y_pred_raw = self.pls_.predict(X)
        if len(self.classes_) == 2:
            y_pred = (y_pred_raw > 0.5).astype(int).ravel()
            return self.encoder_.inverse_transform(y_pred)
        else:
            y_pred = np.argmax(y_pred_raw, axis=1)
            return self.encoder_.categories_[0][y_pred]



[docs]
    def predict_proba(self, X):
        X = np.asarray(X)
        y_pred_raw = self.pls_.predict(X)
        if len(self.classes_) == 2:
            y_pred_raw = np.column_stack([1 - y_pred_raw, y_pred_raw])
        return y_pred_raw



[docs]
    def get_params(self, deep=True):
        return {"n_components": self.n_components}



[docs]
    def set_params(self, **params):
        for key, value in params.items():
            setattr(self, key, value)
        return self