Разреженный вектор vs плотный вектор
как создать SparseVector
и плотные векторные представления
Если DenseVector
- это:
denseV = np.array([0., 3., 0., 4.])
каким будет разреженное векторное представление ?
2 ответов
Если я не совсем неправильно понял ваши сомнения,документация по типу данных MLlib иллюстрирует это весьма наглядно:
import org.apache.spark.mllib.linalg.Vector;
import org.apache.spark.mllib.linalg.Vectors;
// Create a dense vector (1.0, 0.0, 3.0).
Vector dv = Vectors.dense(1.0, 0.0, 3.0);
// Create a sparse vector (1.0, 0.0, 3.0) by specifying its indices and values corresponding to nonzero entries.
Vector sv = Vectors.sparse(3, new int[] {0, 2}, new double[] {1.0, 3.0});
где второй аргумент Vectors.sparse
- массив индексов, а третий аргумент-массив фактических значений в этих индексах.
разреженные векторы-это когда у вас много значений в векторе как ноль. В то время как плотный вектор-это когда большинство значений в векторе не равно нулю.
Если вам нужно создать разреженный вектор из плотной вектор указан, используйте следующий синтаксис:
Vector sparseVector = Vectors.sparse(4, new int[] {1, 3}, new double[] {3.0, 4.0});