cpp-ml-library/SupportVectorRegression_8hpp_source.html

 #ifndef SUPPORT_VECTOR_REGRESSION_HPP

 #define SUPPORT_VECTOR_REGRESSION_HPP


 #include <vector>

 #include <cmath>

 #include <algorithm>

 #include <limits>

 #include <functional>

 #include <numeric>

 #include <random>

 #include <cassert>


 class SupportVectorRegression {

 public:

     enum class KernelType {

         LINEAR,

         POLYNOMIAL,

         RBF

     };


     SupportVectorRegression(double C = 1.0, double epsilon = 0.1, KernelType kernel_type = KernelType::RBF,

                             int degree = 3, double gamma = 1.0, double coef0 = 0.0);


     ~SupportVectorRegression();


     void fit(const std::vector<std::vector<double>>& X, const std::vector<double>& y);


     std::vector<double> predict(const std::vector<std::vector<double>>& X) const;


 private:

     double C;

     double epsilon;

     KernelType kernel_type;

     int degree;

     double gamma;

     double coef0;


     std::vector<std::vector<double>> X_train;

     std::vector<double> y_train;

     std::vector<double> alpha;

     std::vector<double> alpha_star;

     double b;


     std::function<double(const std::vector<double>&, const std::vector<double>&)> kernel;


     void initialize_kernel();


     void solve();


     double predict_sample(const std::vector<double>& x) const;


     double compute_kernel(const std::vector<double>& x1, const std::vector<double>& x2) const;


     std::mt19937 rng;


     std::vector<double> errors;


     void initialize_errors();


     void update_error(size_t i);


     size_t select_second_index(size_t i);

 };


 SupportVectorRegression::SupportVectorRegression(double C, double epsilon, KernelType kernel_type,

                                                  int degree, double gamma, double coef0)

     : C(C), epsilon(epsilon), kernel_type(kernel_type), degree(degree), gamma(gamma), coef0(coef0), b(0.0) {

     initialize_kernel();

     rng.seed(std::random_device{}());

 }


 SupportVectorRegression::~SupportVectorRegression() {}


 void SupportVectorRegression::initialize_kernel() {

     if (kernel_type == KernelType::LINEAR) {

         kernel = [](const std::vector<double>& x1, const std::vector<double>& x2) {

             return std::inner_product(x1.begin(), x1.end(), x2.begin(), 0.0);

         };

     } else if (kernel_type == KernelType::POLYNOMIAL) {

         kernel = [this](const std::vector<double>& x1, const std::vector<double>& x2) {

             return std::pow(gamma * std::inner_product(x1.begin(), x1.end(), x2.begin(), 0.0) + coef0, degree);

         };

     } else if (kernel_type == KernelType::RBF) {

         kernel = [this](const std::vector<double>& x1, const std::vector<double>& x2) {

             double sum = 0.0;

             for (size_t i = 0; i < x1.size(); ++i) {

                 double diff = x1[i] - x2[i];

                 sum += diff * diff;

             }

             return std::exp(-gamma * sum);

         };

     }

 }


 void SupportVectorRegression::fit(const std::vector<std::vector<double>>& X, const std::vector<double>& y) {

     X_train = X;

     y_train = y;

     size_t n_samples = X_train.size();


     alpha.resize(n_samples, 0.0);

     alpha_star.resize(n_samples, 0.0);


     initialize_errors();


     solve();

 }


 std::vector<double> SupportVectorRegression::predict(const std::vector<std::vector<double>>& X) const {

     std::vector<double> predictions;

     predictions.reserve(X.size());

     for (const auto& x : X) {

         predictions.push_back(predict_sample(x));

     }

     return predictions;

 }


 void SupportVectorRegression::initialize_errors() {

     size_t n_samples = X_train.size();

     errors.resize(n_samples);

     for (size_t i = 0; i < n_samples; ++i) {

         errors[i] = predict_sample(X_train[i]) - y_train[i];

     }

 }


 double SupportVectorRegression::predict_sample(const std::vector<double>& x) const {

     double result = b;

     size_t n_samples = X_train.size();

     for (size_t i = 0; i < n_samples; ++i) {

         double coeff = alpha[i] - alpha_star[i];

         if (std::abs(coeff) > 1e-8) {

             result += coeff * compute_kernel(X_train[i], x);

         }

     }

     return result;

 }


 double SupportVectorRegression::compute_kernel(const std::vector<double>& x1, const std::vector<double>& x2) const {

     return kernel(x1, x2);

 }


 void SupportVectorRegression::update_error(size_t i) {

     errors[i] = predict_sample(X_train[i]) - y_train[i];

 }


 size_t SupportVectorRegression::select_second_index(size_t i) {

     size_t n_samples = X_train.size();

     std::uniform_int_distribution<size_t> dist(0, n_samples - 1);

     size_t j = dist(rng);

     while (j == i) {

         j = dist(rng);

     }

     return j;

 }


 void SupportVectorRegression::solve() {

     size_t n_samples = X_train.size();

     size_t max_passes = 5;

     size_t passes = 0;

     double tol = 1e-3;


     while (passes < max_passes) {

         size_t num_changed_alphas = 0;

         for (size_t i = 0; i < n_samples; ++i) {

             double E_i = errors[i];


             // Check KKT conditions for alpha[i]

             bool violate_KKT_alpha = ((alpha[i] < C) && (E_i > epsilon)) || ((alpha[i] > 0) && (E_i < epsilon));


             // Check KKT conditions for alpha_star[i]

             bool violate_KKT_alpha_star = ((alpha_star[i] < C) && (E_i < -epsilon)) || ((alpha_star[i] > 0) && (E_i > -epsilon));


             if (violate_KKT_alpha || violate_KKT_alpha_star) {

                 size_t j = select_second_index(i);

                 double E_j = errors[j];


                 // Compute eta

                 double K_ii = compute_kernel(X_train[i], X_train[i]);

                 double K_jj = compute_kernel(X_train[j], X_train[j]);

                 double K_ij = compute_kernel(X_train[i], X_train[j]);

                 double eta = K_ii + K_jj - 2 * K_ij;


                 if (eta <= 0) {

                     continue;

                 }


                 double alpha_i_old = alpha[i];

                 double alpha_star_i_old = alpha_star[i];

                 double alpha_j_old = alpha[j];

                 double alpha_star_j_old = alpha_star[j];


                 // Update alpha[i] and alpha[j]

                 double delta_alpha = 0.0;


                 if (violate_KKT_alpha) {

                     delta_alpha = std::min(C - alpha[i], std::max(-alpha[i], (E_i - E_j) / eta));

                     alpha[i] += delta_alpha;

                     alpha[j] -= delta_alpha;

                 } else if (violate_KKT_alpha_star) {

                     delta_alpha = std::min(C - alpha_star[i], std::max(-alpha_star[i], -(E_i - E_j) / eta));

                     alpha_star[i] += delta_alpha;

                     alpha_star[j] -= delta_alpha;

                 }


                 // Update threshold b

                 double b1 = b - E_i - delta_alpha * (K_ii - K_ij);

                 double b2 = b - E_j - delta_alpha * (K_ij - K_jj);


                 if ((alpha[i] > 0 && alpha[i] < C) || (alpha_star[i] > 0 && alpha_star[i] < C))

                     b = b1;

                 else if ((alpha[j] > 0 && alpha[j] < C) || (alpha_star[j] > 0 && alpha_star[j] < C))

                     b = b2;

                 else

                     b = (b1 + b2) / 2.0;


                 // Update error cache

                 update_error(i);

                 update_error(j);


                 num_changed_alphas++;

             }

         }


         if (num_changed_alphas == 0)

             passes++;

         else

             passes = 0;

     }

 }


 #endif // SUPPORT_VECTOR_REGRESSION_HPP

SupportVectorRegression
Support Vector Regression using the ε-insensitive loss function.
Definition: SupportVectorRegression.hpp:22

SupportVectorRegression::~SupportVectorRegression
~SupportVectorRegression()
Destructor for SupportVectorRegression.
Definition: SupportVectorRegression.hpp:141

SupportVectorRegression::predict
std::vector< double > predict(const std::vector< std::vector< double >> &X) const
Predicts target values for the given input data.
Definition: SupportVectorRegression.hpp:177

SupportVectorRegression::KernelType
KernelType
Kernel function types.
Definition: SupportVectorRegression.hpp:27

SupportVectorRegression::fit
void fit(const std::vector< std::vector< double >> &X, const std::vector< double > &y)
Fits the SVR model to the training data.
Definition: SupportVectorRegression.hpp:164

SupportVectorRegression::SupportVectorRegression
SupportVectorRegression(double C=1.0, double epsilon=0.1, KernelType kernel_type=KernelType::RBF, int degree=3, double gamma=1.0, double coef0=0.0)
Constructs a SupportVectorRegression model.
Definition: SupportVectorRegression.hpp:134