docs/gpusparsematrix_8h_source.html

/*

 * Copyright (c) 2013-2015:  G-CSC, Goethe University Frankfurt

 * Author: Martin Rupp

 *

 * This file is part of UG4.

 *

 * UG4 is free software: you can redistribute it and/or modify it under the

 * terms of the GNU Lesser General Public License version 3 (as published by the

 * Free Software Foundation) with the following additional attribution

 * requirements (according to LGPL/GPL v3 §7):

 *

 * (1) The following notice must be displayed in the Appropriate Legal Notices

 * of covered and combined works: "Based on UG4 (www.ug4.org/license)".

 *

 * (2) The following notice must be displayed at a prominent place in the

 * terminal output of covered works: "Based on UG4 (www.ug4.org/license)".

 *

 * (3) The following bibliography is recommended for citation and must be

 * preserved in all covered files:

 * "Reiter, S., Vogel, A., Heppner, I., Rupp, M., and Wittum, G. A massively

 *   parallel geometric multigrid solver on hierarchically distributed grids.

 *   Computing and visualization in science 16, 4 (2013), 151-164"

 * "Vogel, A., Reiter, S., Rupp, M., Nägel, A., and Wittum, G. UG4 -- a novel

 *   flexible software system for simulating pde based models on high performance

 *   computers. Computing and visualization in science 16, 4 (2013), 165-179"

 *

 * This program is distributed in the hope that it will be useful,

 * but WITHOUT ANY WARRANTY; without even the implied warranty of

 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the

 * GNU Lesser General Public License for more details.

 */


#ifndef __H__UG__CPU_ALGEBRA__GPUSparseMatrix__

#define __H__UG__CPU_ALGEBRA__GPUSparseMatrix__


#include "math.h"

#include "common/common.h"

#include "../algebra_common/sparsematrix_util.h"

#include <iostream>

#include <algorithm>

#include "common/util/ostream_util.h"


#include "../algebra_common/connection.h"

#include "../algebra_common/matrixrow.h"

#include "../common/operations_mat/operations_mat.h"


#include "cuda/cuda_manager.h"

#include "common/debug_print.h"


#define PROFILE_GPUMATRIX(name) PROFILE_BEGIN_GROUP(name, "GPUSparseMatrix algebra")


namespace ug{


// example for the variable CRS storage structure:

// say we have:

// rowStart = 0 3 8

// rowEnd = 3 6 11

// rowMax = 3 8 11

// cols ( | marking end of row): 2 5 6 | 2 6 7 x x| 8 9 10


// now insert (0 3): row 0 is full (rowEnd[0]==rowMax[0]), copy it to the end, and insert index

// rowStart = 11 3 8

// rowEnd = 15 6 11

// rowMax = 17 8 11

// cols ( | marking end of row): x x x | 2 6 7 x x| 8 9 10 | 2 3 5 6 x x |


// now insert (1 3): row 1 not full, we can add it

// rowStart 11 3 8

// rowEnd 15 7 11

// rowMax = 17 8 11

// cols : x x x | 2 3 6 7 x | 8 9 10 | 2 3 5 6 x x |


// defragment:

// rowStart 0 4 8

// rowEnd 4 8 11

// rowMax = 4 8 11

// cols : 2 3 5 6 | 2 3 6 7 | 8 9 10


template<typename TValueType>


class GPUSparseMatrix

{

public:

  typedef TValueType value_type;

  enum {rows_sorted=true};


  typedef GPUSparseMatrix<value_type> this_type;


public:

  typedef AlgebraicConnection<TValueType> connection;

  typedef MatrixRow<this_type> row_type;

  typedef ConstMatrixRow<this_type> const_row_type;


public:

  // construction etc

  //----------------------


  GPUSparseMatrix();


  virtual ~GPUSparseMatrix ()

  {

    freeGPU();

  }

  virtual ~GPUSparseMatrix () {…}


  bool resize_and_clear(size_t newRows, size_t newCols);

  bool resize_and_keep_values(size_t newRows, size_t newCols);


  bool set_as_transpose_of(const GPUSparseMatrix<value_type> &B, double scale=1.0);


  bool set_as_copy_of(const GPUSparseMatrix<value_type> &B, double scale=1.0);


  GPUSparseMatrix<value_type> &operator = (const GPUSparseMatrix<value_type> &B)

  {

    set_as_copy_of(B);

    return *this;

  }

  GPUSparseMatrix<value_type> &operator = (const GPUSparseMatrix<value_type> &B) {…}


public:

  template<typename vector_t>

  bool axpy(vector_t &dest,

      const number &alpha1, const vector_t &v1,

      const number &beta1, const vector_t &w1) const;


  template<typename vector_t>

  void axpy(double alpha, vector_t &x, double beta, const vector_t &y) const;


  template<typename vector_t>

  bool axpy_transposed(vector_t &dest,

      const number &alpha1, const vector_t &v1,

      const number &beta1, const vector_t &w1) const;


  template<typename vector_t>


  void apply_ignore_zero_rows(vector_t &dest,

      const number &beta1, const vector_t &w1) const { assert(0); }

  void apply_ignore_zero_rows(vector_t &dest, {…}


  template<typename vector_t>


  void apply_transposed_ignore_zero_rows(vector_t &dest,

      const number &beta1, const vector_t &w1) const { assert(0); }

  void apply_transposed_ignore_zero_rows(vector_t &dest, {…}


  // DEPRECATED!

    // apply is deprecated because of axpy(res, 0.0, res, 1.0, beta, w1)

    template<typename Vector_type>


    bool apply(Vector_type &res, const Vector_type &x) const

    {

      return axpy(res, 0.0, res, 1.0, x);

    }

    bool apply(Vector_type &res, const Vector_type &x) const {…}


    // apply is deprecated because of axpy(res, 0.0, res, 1.0, beta, w1)

    template<typename Vector_type>


    bool apply_transposed(Vector_type &res, const Vector_type &x) const

    {

      return axpy_transposed(res, 0.0, res, 1.0, x);

    }

    bool apply_transposed(Vector_type &res, const Vector_type &x) const {…}


    // matmult_minus is deprecated because of axpy(res, 1.0, res, -1.0, x);

    template<typename Vector_type>


    bool matmul_minus(Vector_type &res, const Vector_type &x) const

    {

      return axpy(res, 1.0, res, -1.0, x);

    }

    bool matmul_minus(Vector_type &res, const Vector_type &x) const {…}


  inline bool is_isolated(size_t i) const;


  bool scale(double d);

  GPUSparseMatrix<value_type> &operator *= (double d) { scale(d); return *this; }


  // submatrix set/get functions

  //-------------------------------


  template<typename M>

  void add(const M &mat);

  template<typename M>

  void set(const M &mat);

  template<typename M>

  void get(M &mat) const;


  // finalizing functions

  //----------------------


  inline void check_rc(size_t r, size_t c) const

  {

    UG_ASSERT(r < num_rows() && c < num_cols(), "tried to access element (" << r << ", " << c << ") of " << num_rows() << " x " << num_cols() << " matrix.");

  }

  inline void check_rc(size_t r, size_t c) const {…}


  bool set(double a);


  const value_type &operator () (size_t r, size_t c)  const

    {

    check_rc(r, c);

        int j=get_index_const(r, c);

    if(j == -1)

    {

      static value_type v(0.0);

      return v;

    }

        UG_ASSERT(cols[j]==(int)c && j >= rowStart[r] && j < rowEnd[r], "");

        return values[j];

    }

  const value_type &operator () (size_t r, size_t c)  const {…}


  value_type &operator() (size_t r, size_t c)

  {

    check_rc(r, c);

    int j=get_index(r, c);

        UG_ASSERT(j != -1 && cols[j]==(int)c && j >= rowStart[r] && j < rowEnd[r], "");

        return values[j];

    }

  value_type &operator() (size_t r, size_t c) {…}


public:

  // row functions


  void set_matrix_row(size_t row, connection *c, size_t nr);


  void add_matrix_row(size_t row, connection *c, size_t nr);


  inline size_t num_connections(size_t i) const

  {

    if(rowStart[i] == -1) return 0;

    else return rowEnd[i]-rowStart[i];

  }

  inline size_t num_connections(size_t i) const {…}


  template<typename vector_t>

  inline void mat_mult_add_row(size_t row, typename vector_t::value_type &dest, double alpha, const vector_t &v) const;

public:

  // accessor functions

  //----------------------


  size_t num_rows() const { return rowEnd.size(); }


  size_t num_cols() const { return m_numCols; }


  size_t total_num_connections() const { return nnz; }


public:


  // Iterators

  //---------------------------


  // const_row_iterator


  //typedef const connection * const_row_iterator;

  //typedef connection * const_row_iterator;


  void add_iterator() const

  {

    iIterators++;

  }

  void add_iterator() const {…}


  void remove_iterator() const

  {

    iIterators--;

  }

  void remove_iterator() const {…}

  // a row_iterator has to suppport

  // operator ++, operator +=, index() const, const value_type &value() const, value_type &value()

  // a const_row_iterator has to suppport

  // operator ++, operator +=, index() const, const value_type &value() const


  inline void check_row(size_t row, int i) const

  {

    UG_ASSERT(i < rowEnd[row] && i >= rowStart[row], "row iterator row " << row << " pos " << i << " out of bounds [" << rowStart[row] << ", " << rowEnd[row] << "]");

  }

  inline void check_row(size_t row, int i) const {…}


  class row_iterator

    {

        GPUSparseMatrix &A;

        size_t row;

        size_t i;

    public:

        inline void check() const {A.check_row(row, i); }

        row_iterator(GPUSparseMatrix &_A, size_t _row, size_t _i) : A(_A), row(_row), i(_i) { A.add_iterator(); }

        ~row_iterator() { A.remove_iterator(); }

        row_iterator *operator ->() { return this; }

        value_type &value() { check(); return A.values[i];   }

        size_t index() const { check(); return A.cols[i]; }

        bool operator != (const row_iterator &o) const { return i != o.i;  }

        void operator ++ () { ++i; }

    void operator += (int nr) { i+=nr; }

    bool operator == (const row_iterator &other) const { return other.i == i; check(); }

    };

  class row_iterator {…};


    class const_row_iterator

    {

        const GPUSparseMatrix &A;

        size_t row;

        size_t i;

    public:

        inline void check() const {A.check_row(row, i); }

        const_row_iterator(const GPUSparseMatrix &_A, size_t _row, size_t _i) : A(_A), row(_row), i(_i) {A.add_iterator();}

        ~const_row_iterator() { A.remove_iterator(); }

        const_row_iterator *operator ->() { return this; }

        const value_type &value() const { check(); return A.values[i];   }

        size_t index() const { check(); return A.cols[i];     }

        bool operator != (const const_row_iterator &o) const { return i != o.i; }

        void operator ++ () { ++i; }

        void operator += (int nr) { i+=nr; }

    bool operator == (const const_row_iterator &other) const { return other.i == i; }

    };

    class const_row_iterator {…};


  row_iterator         begin_row(size_t r)         { return row_iterator(*this, r, rowStart[r]);  }

    row_iterator         end_row(size_t r)           { return row_iterator(*this, r, rowEnd[r]);  }

    const_row_iterator   begin_row(size_t r) const   { return const_row_iterator(*this, r, rowStart[r]);  }

    const_row_iterator   end_row(size_t r)   const   { return const_row_iterator(*this, r, rowEnd[r]);  }


    row_type    get_row(size_t r)     { return row_type(*this, r); }

    const_row_type  get_row(size_t r) const { return const_row_type(*this, r); }


public:

  // connectivity functions

  //-------------------------


    bool has_connection(size_t r, size_t c) const

    {

      check_rc(r, c);

      bool bFound;

      get_connection(r, c, bFound);

      return bFound;

    }

    bool has_connection(size_t r, size_t c) const {…}


  row_iterator get_iterator_or_next(size_t r, size_t c)

  {

    check_rc(r, c);

    if(rowStart[r] == -1 || rowStart[r] == rowEnd[r])

          return end_row(r);

        else

        {

          int j=get_index_internal(r, c);

          if(j > maxValues) return end_row(r);

          else return row_iterator(*this, r, j);

        }

    }

  row_iterator get_iterator_or_next(size_t r, size_t c) {…}


  const_row_iterator get_connection(size_t r, size_t c, bool &bFound) const

  {

    check_rc(r, c);

        int j=get_index_const(r, c);

    if(j != -1)

    {

      bFound = true;

      return const_row_iterator(*this, r, j);

    }

    else

    {

      bFound = false;

      return end_row(r);

    }

    }

  const_row_iterator get_connection(size_t r, size_t c, bool &bFound) const {…}


  row_iterator get_connection(size_t r, size_t c, bool &bFound)

  {

    check_rc(r, c);

    int j=get_index_const(r, c);

    if(j != -1)

    {

      bFound = true;

      return row_iterator(*this, r, j);

    }

    else

    {

      bFound = false;

      return end_row(r);

    }

  }

  row_iterator get_connection(size_t r, size_t c, bool &bFound) {…}


  const_row_iterator get_connection(size_t r, size_t c) const

  {

    bool b;

    return get_connection(r, c, b);

  }

  const_row_iterator get_connection(size_t r, size_t c) const {…}


  row_iterator get_connection(size_t r, size_t c)

  {

    check_rc(r, c);

    assert(bNeedsValues);

        int j=get_index(r, c);

    return row_iterator(*this, r, j);

  }

  row_iterator get_connection(size_t r, size_t c) {…}


  void defragment()

    {

    if(num_rows() != 0 && num_cols() != 0)

      copyToNewSize(nnz);

    }

  void defragment() {…}


public:

  // output functions

  //----------------------


  void print(const char * const name = NULL) const;

  void printtype() const;


  void print_to_file(const char *filename) const;

  void printrow(size_t row) const;


  friend std::ostream &operator<<(std::ostream &out, const GPUSparseMatrix &m)

  {

    out << "GPUSparseMatrix " //<< m.name

    << " [ " << m.num_rows() << " x " << m.num_cols() << " ]";

    return out;

  }

  friend std::ostream &operator<<(std::ostream &out, const GPUSparseMatrix &m) {…};


  void p() const { print(); } // for use in gdb

  void pr(size_t row) const {printrow(row); } // for use in gdb


private:

  // disallowed operations (not defined):

  //---------------------------------------

  GPUSparseMatrix(GPUSparseMatrix&);


    void assureValuesSize(size_t s);

    size_t get_nnz() const { return nnz; }


protected:

  int get_index_internal(size_t row, int col) const;

    int get_index_const(int r, int c) const;

    int get_index(int r, int c);


    void copyToNewSize(size_t newSize)

    {

      copyToNewSize(newSize, num_cols());

    }

    void copyToNewSize(size_t newSize) {…}

    void copyToNewSize(size_t newSize, size_t maxCols);

  void check_fragmentation() const;

  int get_nnz_max_cols(size_t maxCols);


protected:

    std::vector<int> rowStart;

    std::vector<int> rowEnd;

    std::vector<int> rowMax;

    std::vector<int> cols;

    size_t fragmented;

    size_t nnz;

    bool bNeedsValues;


    std::vector<value_type> values;

    int maxValues;

    int m_numCols;

    mutable int iIterators;


public:


   void initGPU()

   {

     d_cols = d_rowStart = NULL;

     d_values = NULL;

     descr = 0;

     bOnDevice = false;

   }

   void initGPU() {…}


   void freeGPU()

   {

     cudaFree(d_cols);

     cudaFree(d_rowStart);

     cudaFree(d_values);

   }

   void freeGPU() {…}


   const int *get_device_cols() const { check_device(); return d_cols; }

   const int *get_device_rowStart() const { check_device(); return d_rowStart; }

   const double *get_device_value_ptr() const { check_device(); return d_values; }

   cusparseMatDescr_t get_matrix_descr() const { check_device(); return descr; }


   void copy_to_device()

   {

     CUDAManager::get_instance();

     descr = 0;

     cusparseStatus_t cusparseStatus = cusparseCreateMatDescr(&descr);


     if (checkCudaErrors(cusparseStatus))

     {

       exit(EXIT_FAILURE);

     }


     cusparseSetMatType(descr,CUSPARSE_MATRIX_TYPE_GENERAL);

     cusparseSetMatIndexBase(descr,CUSPARSE_INDEX_BASE_ZERO);


     defragment();

     d_values = &values[0];


     assert(cols.size() == values.size() && cols.size() == nnz);


     UG_LOG("cols.size = " << cols.size()*sizeof(int) << " values.size() == " << values.size()*sizeof(value_type) << " rowStart.size = " << rowStart.size()*sizeof(int) << "\n");


     UG_LOG("gpusparsematrix.h:"<<__LINE__ << "\n")

     d_cols = CudaCreateAndCopyToDevice(cols);

     UG_LOG("gpusparsematrix.h:"<<__LINE__ << "\n")

     d_rowStart = CudaCreateAndCopyToDevice(rowStart);

     UG_LOG("gpusparsematrix.h:"<<__LINE__ << "\n")

//     PrintVector(values, "GPUVector::values");

     d_values = CudaCreateAndCopyToDevice(values);

   }

   void copy_to_device() {…}


   void check_device() const

   {

     if(bOnDevice==true) return;

     GPUSparseMatrix<value_type>* c = const_cast<GPUSparseMatrix<value_type>*>(this);

     c->bOnDevice=true;

     c->copy_to_device();

   }

   void check_device() const {…}

private:

   //using CRSSparseMatrix::nnz;


   int *d_cols, *d_rowStart;

   double *d_values;

   cusparseMatDescr_t descr;


   bool bOnDevice;

};

class GPUSparseMatrix {…};


template<typename T>


struct matrix_algebra_type_traits<GPUSparseMatrix<T> >

{

  enum{

    type=MATRIX_USE_ROW_FUNCTIONS

  };

};

struct matrix_algebra_type_traits<GPUSparseMatrix<T> > {…};


template<typename vector_t, typename matrix_t>


inline void MatMultTransposedAdd(vector_t &dest,

    const number &alpha1, const vector_t &v1,

    const number &beta1, const GPUSparseMatrix<matrix_t> &A1, const vector_t &w1)

{

  A1.axpy_transposed(dest, alpha1, v1, beta1, w1);

}

inline void MatMultTransposedAdd(vector_t &dest, {…}


// end group cpu_algebra


} // namespace ug


//#include "matrixrow.h"

#include "gpusparsematrix_impl.h"

#include "gpusparsematrix_print.h"


#endif

name
location name
Definition checkpoint_util.lua:128

ug::AlgebraicConnection
Definition connection.h:40

ug::CUDAManager::get_instance
static CUDAManager & get_instance()
Definition cuda_manager.cpp:153

ug::ConstMatrixRow
Definition matrixrow.h:118

ug::GPUSparseMatrix::const_row_iterator
Definition gpusparsematrix.h:400

ug::GPUSparseMatrix::const_row_iterator::const_row_iterator
const_row_iterator(const GPUSparseMatrix &_A, size_t _row, size_t _i)
Definition gpusparsematrix.h:406

ug::GPUSparseMatrix::const_row_iterator::row
size_t row
Definition gpusparsematrix.h:402

ug::GPUSparseMatrix::const_row_iterator::check
void check() const
Definition gpusparsematrix.h:405

ug::GPUSparseMatrix::const_row_iterator::A
const GPUSparseMatrix & A
Definition gpusparsematrix.h:401

ug::GPUSparseMatrix::const_row_iterator::operator!=
bool operator!=(const const_row_iterator &o) const
Definition gpusparsematrix.h:411

ug::GPUSparseMatrix::const_row_iterator::operator==
bool operator==(const const_row_iterator &other) const
Definition gpusparsematrix.h:414

ug::GPUSparseMatrix::const_row_iterator::i
size_t i
Definition gpusparsematrix.h:403

ug::GPUSparseMatrix::const_row_iterator::operator->
const_row_iterator * operator->()
Definition gpusparsematrix.h:408

ug::GPUSparseMatrix::const_row_iterator::operator++
void operator++()
Definition gpusparsematrix.h:412

ug::GPUSparseMatrix::const_row_iterator::~const_row_iterator
~const_row_iterator()
Definition gpusparsematrix.h:407

ug::GPUSparseMatrix::const_row_iterator::index
size_t index() const
Definition gpusparsematrix.h:410

ug::GPUSparseMatrix::const_row_iterator::operator+=
void operator+=(int nr)
Definition gpusparsematrix.h:413

ug::GPUSparseMatrix::const_row_iterator::value
const value_type & value() const
Definition gpusparsematrix.h:409

ug::GPUSparseMatrix::row_iterator
Definition gpusparsematrix.h:383

ug::GPUSparseMatrix::row_iterator::~row_iterator
~row_iterator()
Definition gpusparsematrix.h:390

ug::GPUSparseMatrix::row_iterator::operator+=
void operator+=(int nr)
Definition gpusparsematrix.h:396

ug::GPUSparseMatrix::row_iterator::i
size_t i
Definition gpusparsematrix.h:386

ug::GPUSparseMatrix::row_iterator::A
GPUSparseMatrix & A
Definition gpusparsematrix.h:384

ug::GPUSparseMatrix::row_iterator::operator++
void operator++()
Definition gpusparsematrix.h:395

ug::GPUSparseMatrix::row_iterator::row
size_t row
Definition gpusparsematrix.h:385

ug::GPUSparseMatrix::row_iterator::row_iterator
row_iterator(GPUSparseMatrix &_A, size_t _row, size_t _i)
Definition gpusparsematrix.h:389

ug::GPUSparseMatrix::row_iterator::operator->
row_iterator * operator->()
Definition gpusparsematrix.h:391

ug::GPUSparseMatrix::row_iterator::operator==
bool operator==(const row_iterator &other) const
Definition gpusparsematrix.h:397

ug::GPUSparseMatrix::row_iterator::index
size_t index() const
Definition gpusparsematrix.h:393

ug::GPUSparseMatrix::row_iterator::check
void check() const
Definition gpusparsematrix.h:388

ug::GPUSparseMatrix::row_iterator::value
value_type & value()
Definition gpusparsematrix.h:392

ug::GPUSparseMatrix::row_iterator::operator!=
bool operator!=(const row_iterator &o) const
Definition gpusparsematrix.h:394

ug::GPUSparseMatrix
sparse matrix for big, variable sparse matrices.
Definition gpusparsematrix.h:102

ug::GPUSparseMatrix::get_iterator_or_next
row_iterator get_iterator_or_next(size_t r, size_t c)
Definition gpusparsematrix.h:445

ug::GPUSparseMatrix::check_device
void check_device() const
Definition gpusparsematrix.h:645

ug::GPUSparseMatrix::begin_row
const_row_iterator begin_row(size_t r) const
Definition gpusparsematrix.h:422

ug::GPUSparseMatrix::is_isolated
bool is_isolated(size_t i) const
check for isolated condition of an index
Definition gpusparsematrix_impl.h:218

ug::GPUSparseMatrix::check_rc
void check_rc(size_t r, size_t c) const
Definition gpusparsematrix.h:253

ug::GPUSparseMatrix::resize_and_keep_values
bool resize_and_keep_values(size_t newRows, size_t newCols)
Definition gpusparsematrix_impl.h:84

ug::GPUSparseMatrix::d_rowStart
int * d_rowStart
Definition gpusparsematrix.h:655

ug::GPUSparseMatrix::operator<<
friend std::ostream & operator<<(std::ostream &out, const GPUSparseMatrix &m)
Definition gpusparsematrix.h:540

ug::GPUSparseMatrix::matmul_minus
bool matmul_minus(Vector_type &res, const Vector_type &x) const
calculate res -= A x
Definition gpusparsematrix.h:208

ug::GPUSparseMatrix::remove_iterator
void remove_iterator() const
Definition gpusparsematrix.h:364

ug::GPUSparseMatrix::end_row
row_iterator end_row(size_t r)
Definition gpusparsematrix.h:421

ug::GPUSparseMatrix::get_matrix_descr
cusparseMatDescr_t get_matrix_descr() const
Definition gpusparsematrix.h:612

ug::GPUSparseMatrix::get_nnz
size_t get_nnz() const
Definition gpusparsematrix.h:558

ug::GPUSparseMatrix::d_values
double * d_values
Definition gpusparsematrix.h:656

ug::GPUSparseMatrix::set
void set(const M &mat)
set local matrix
Definition gpusparsematrix_impl.h:320

ug::GPUSparseMatrix::get_device_rowStart
const int * get_device_rowStart() const
Definition gpusparsematrix.h:610

ug::GPUSparseMatrix::get_device_cols
const int * get_device_cols() const
Definition gpusparsematrix.h:609

ug::GPUSparseMatrix::set_as_transpose_of
bool set_as_transpose_of(const GPUSparseMatrix< value_type > &B, double scale=1.0)
write in a empty GPUSparseMatrix (this) the transpose GPUSparseMatrix of B.
Definition gpusparsematrix_impl.h:113

ug::GPUSparseMatrix::rowStart
std::vector< int > rowStart
Definition gpusparsematrix.h:574

ug::GPUSparseMatrix::defragment
void defragment()
Definition gpusparsematrix.h:524

ug::GPUSparseMatrix::rowMax
std::vector< int > rowMax
Definition gpusparsematrix.h:576

ug::GPUSparseMatrix::const_row_type
ConstMatrixRow< this_type > const_row_type
Definition gpusparsematrix.h:112

ug::GPUSparseMatrix::add_matrix_row
void add_matrix_row(size_t row, connection *c, size_t nr)
Definition gpusparsematrix_impl.h:264

ug::GPUSparseMatrix::begin_row
row_iterator begin_row(size_t r)
Definition gpusparsematrix.h:420

ug::GPUSparseMatrix::cols
std::vector< int > cols
Definition gpusparsematrix.h:577

ug::GPUSparseMatrix::values
std::vector< value_type > values
Definition gpusparsematrix.h:582

ug::GPUSparseMatrix::num_rows
size_t num_rows() const
returns number of rows
Definition gpusparsematrix.h:337

ug::GPUSparseMatrix::num_connections
size_t num_connections(size_t i) const
returns number of connections of row row.
Definition gpusparsematrix.h:323

ug::GPUSparseMatrix::assureValuesSize
void assureValuesSize(size_t s)
Definition gpusparsematrix_impl.h:555

ug::GPUSparseMatrix::get_nnz_max_cols
int get_nnz_max_cols(size_t maxCols)
Definition gpusparsematrix_impl.h:565

ug::GPUSparseMatrix::value_type
TValueType value_type
Definition gpusparsematrix.h:104

ug::GPUSparseMatrix::get_index_internal
int get_index_internal(size_t row, int col) const
Definition gpusparsematrix_impl.h:350

ug::GPUSparseMatrix::get_device_value_ptr
const double * get_device_value_ptr() const
Definition gpusparsematrix.h:611

ug::GPUSparseMatrix::~GPUSparseMatrix
virtual ~GPUSparseMatrix()
destructor
Definition gpusparsematrix.h:121

ug::GPUSparseMatrix::operator*=
GPUSparseMatrix< value_type > & operator*=(double d)
Definition gpusparsematrix.h:223

ug::GPUSparseMatrix::apply_transposed
bool apply_transposed(Vector_type &res, const Vector_type &x) const
calculate res = A.T x
Definition gpusparsematrix.h:200

ug::GPUSparseMatrix::apply_transposed_ignore_zero_rows
void apply_transposed_ignore_zero_rows(vector_t &dest, const number &beta1, const vector_t &w1) const
calculated dest = beta1*A*w1 . For empty cols of A (=empty rows of A^T), dest will not be changed
Definition gpusparsematrix.h:183

ug::GPUSparseMatrix::set_as_copy_of
bool set_as_copy_of(const GPUSparseMatrix< value_type > &B, double scale=1.0)
create/recreate this as a copy of GPUSparseMatrix B
Definition gpusparsematrix_impl.h:273

ug::GPUSparseMatrix::set_matrix_row
void set_matrix_row(size_t row, connection *c, size_t nr)
Definition gpusparsematrix_impl.h:230

ug::GPUSparseMatrix::end_row
const_row_iterator end_row(size_t r) const
Definition gpusparsematrix.h:423

ug::GPUSparseMatrix::row_type
MatrixRow< this_type > row_type
Definition gpusparsematrix.h:111

ug::GPUSparseMatrix::get_row
row_type get_row(size_t r)
Definition gpusparsematrix.h:425

ug::GPUSparseMatrix::pr
void pr(size_t row) const
Definition gpusparsematrix.h:549

ug::GPUSparseMatrix::this_type
GPUSparseMatrix< value_type > this_type
Definition gpusparsematrix.h:107

ug::GPUSparseMatrix::axpy
bool axpy(vector_t &dest, const number &alpha1, const vector_t &v1, const number &beta1, const vector_t &w1) const
calculate dest = alpha1*v1 + beta1*A*w1 (A = this matrix)
Definition gpusparsematrix_impl.h:170

ug::GPUSparseMatrix::rowEnd
std::vector< int > rowEnd
Definition gpusparsematrix.h:575

ug::GPUSparseMatrix::scale
bool scale(double d)
Definition gpusparsematrix_impl.h:286

ug::GPUSparseMatrix::apply_ignore_zero_rows
void apply_ignore_zero_rows(vector_t &dest, const number &beta1, const vector_t &w1) const
calculated dest = beta1*A*w1 . For empty rows, dest will not be changed
Definition gpusparsematrix.h:178

ug::GPUSparseMatrix::get_index_const
int get_index_const(int r, int c) const
Definition gpusparsematrix_impl.h:381

ug::GPUSparseMatrix::get_connection
const_row_iterator get_connection(size_t r, size_t c, bool &bFound) const
Definition gpusparsematrix.h:463

ug::GPUSparseMatrix::descr
cusparseMatDescr_t descr
Definition gpusparsematrix.h:657

ug::GPUSparseMatrix::get_connection
const_row_iterator get_connection(size_t r, size_t c) const
Definition gpusparsematrix.h:504

ug::GPUSparseMatrix::bNeedsValues
bool bNeedsValues
Definition gpusparsematrix.h:580

ug::GPUSparseMatrix::freeGPU
void freeGPU()
Definition gpusparsematrix.h:602

ug::GPUSparseMatrix::GPUSparseMatrix
GPUSparseMatrix(GPUSparseMatrix &)
disallow copy operator

ug::GPUSparseMatrix::iIterators
int iIterators
Definition gpusparsematrix.h:585

ug::GPUSparseMatrix::check_fragmentation
void check_fragmentation() const
Definition gpusparsematrix_impl.h:548

ug::GPUSparseMatrix::add
void add(const M &mat)
Definition gpusparsematrix_impl.h:304

ug::GPUSparseMatrix::mat_mult_add_row
void mat_mult_add_row(size_t row, typename vector_t::value_type &dest, double alpha, const vector_t &v) const
calculates dest += alpha * A[row, .] v;
Definition gpusparsematrix_impl.h:149

ug::GPUSparseMatrix::has_connection
bool has_connection(size_t r, size_t c) const
Definition gpusparsematrix.h:432

ug::GPUSparseMatrix::nnz
size_t nnz
Definition gpusparsematrix.h:579

ug::GPUSparseMatrix::copyToNewSize
void copyToNewSize(size_t newSize)
Definition gpusparsematrix.h:564

ug::GPUSparseMatrix::print_to_file
void print_to_file(const char *filename) const

ug::GPUSparseMatrix::operator()
const value_type & operator()(size_t r, size_t c) const
Definition gpusparsematrix.h:268

ug::GPUSparseMatrix::get
void get(M &mat) const
get local matrix
Definition gpusparsematrix_impl.h:335

ug::GPUSparseMatrix::total_num_connections
size_t total_num_connections() const
returns the total number of connections
Definition gpusparsematrix.h:343

ug::GPUSparseMatrix::rows_sorted
@ rows_sorted
Definition gpusparsematrix.h:105

ug::GPUSparseMatrix::fragmented
size_t fragmented
Definition gpusparsematrix.h:578

ug::GPUSparseMatrix::maxValues
int maxValues
Definition gpusparsematrix.h:583

ug::GPUSparseMatrix::add_iterator
void add_iterator() const
Definition gpusparsematrix.h:360

ug::GPUSparseMatrix::axpy_transposed
bool axpy_transposed(vector_t &dest, const number &alpha1, const vector_t &v1, const number &beta1, const vector_t &w1) const
calculate dest = alpha1*v1 + beta1*A^T*w1 (A = this matrix)
Definition gpusparsematrix_impl.h:190

ug::GPUSparseMatrix::initGPU
void initGPU()
Definition gpusparsematrix.h:595

ug::GPUSparseMatrix::get_connection
row_iterator get_connection(size_t r, size_t c, bool &bFound)
Definition gpusparsematrix.h:483

ug::GPUSparseMatrix::GPUSparseMatrix
GPUSparseMatrix()
constructor for empty GPUSparseMatrix
Definition gpusparsematrix_impl.h:52

ug::GPUSparseMatrix::get_connection
row_iterator get_connection(size_t r, size_t c)
Definition gpusparsematrix.h:515

ug::GPUSparseMatrix::apply
bool apply(Vector_type &res, const Vector_type &x) const
calculate res = A x
Definition gpusparsematrix.h:192

ug::GPUSparseMatrix::d_cols
int * d_cols
Definition gpusparsematrix.h:655

ug::GPUSparseMatrix::p
void p() const
Definition gpusparsematrix.h:548

ug::GPUSparseMatrix::get_row
const_row_type get_row(size_t r) const
Definition gpusparsematrix.h:426

ug::GPUSparseMatrix::operator=
GPUSparseMatrix< value_type > & operator=(const GPUSparseMatrix< value_type > &B)
Definition gpusparsematrix.h:151

ug::GPUSparseMatrix::m_numCols
int m_numCols
Definition gpusparsematrix.h:584

ug::GPUSparseMatrix::copy_to_device
void copy_to_device()
Definition gpusparsematrix.h:614

ug::GPUSparseMatrix::check_row
void check_row(size_t row, int i) const
Definition gpusparsematrix.h:373

ug::GPUSparseMatrix::resize_and_clear
bool resize_and_clear(size_t newRows, size_t newCols)
resizes the GPUSparseMatrix
Definition gpusparsematrix_impl.h:66

ug::GPUSparseMatrix::connection
AlgebraicConnection< TValueType > connection
Definition gpusparsematrix.h:110

ug::GPUSparseMatrix::bOnDevice
bool bOnDevice
Definition gpusparsematrix.h:659

ug::GPUSparseMatrix::num_cols
size_t num_cols() const
returns the number of cols
Definition gpusparsematrix.h:340

ug::GPUSparseMatrix::get_index
int get_index(int r, int c)
Definition gpusparsematrix_impl.h:393

ug::MatrixRow
Definition matrixrow.h:65

common.h

cuda_manager.h

debug_print.h

gpusparsematrix_impl.h

gpusparsematrix_print.h

ug::GPUSparseMatrix::printtype
void printtype() const
Definition gpusparsematrix_print.h:72

ug::GPUSparseMatrix::print
void print(const char *const name=NULL) const
Definition gpusparsematrix_print.h:47

ug::GPUSparseMatrix::printrow
void printrow(size_t row) const
Definition gpusparsematrix_print.h:58

UG_ASSERT
#define UG_ASSERT(expr, msg)
Definition assert.h:70

UG_LOG
#define UG_LOG(msg)
Definition log.h:367

number
double number
Definition types.h:124

ug
the ug namespace

ug::CudaCreateAndCopyToDevice
T::value_type * CudaCreateAndCopyToDevice(T &vec)
Definition cuda_manager.h:163

ug::MatMultTransposedAdd
bool MatMultTransposedAdd(vector_t &dest, const number &alpha1, const vector_t &v1, const number &beta1, const matrix_t &A1, const vector_t &w1)
calculates dest = alpha1*v1 + beta1 * A1 *w1;
Definition operations_mat.h:121

ug::MATRIX_USE_ROW_FUNCTIONS
@ MATRIX_USE_ROW_FUNCTIONS
Definition matrix_algebra_types.h:68

ostream_util.h

ug::matrix_algebra_type_traits
Definition matrix_algebra_types.h:79

ug::matrix_algebra_type_traits::type
static const int type
Definition matrix_algebra_types.h:80