RetroSearch Browse

Home - News ( United States | United Kingdom | Italy | Germany ) - Football scores

Showing content from http://spark.apache.org/docs/latest/api/python/reference/api/pyspark.mllib.feature.Normalizer.html below:

Normalizer — PySpark 4.0.0 documentation

Normalizer#

class pyspark.mllib.feature.Normalizer(p=2.0)[source]#

Normalizes samples individually to unit L^p norm

For any 1 <= p < float(âinfâ), normalizes samples using sum(abs(vector) ^p) ^(1/p) as norm.

For p = float(âinfâ), max(abs(vector)) will be used as norm for normalization.

New in version 1.2.0.

Parameters

pfloat, optional: Normalization in L^p^ space, p = 2 by default.

Examples

>>> from pyspark.mllib.linalg import Vectors
>>> v = Vectors.dense(range(3))
>>> nor = Normalizer(1)
>>> nor.transform(v)
DenseVector([0.0, 0.3333, 0.6667])

>>> rdd = sc.parallelize([v])
>>> nor.transform(rdd).collect()
[DenseVector([0.0, 0.3333, 0.6667])]

>>> nor2 = Normalizer(float("inf"))
>>> nor2.transform(v)
DenseVector([0.0, 0.5, 1.0])

Methods

transform(vector)

Applies unit length normalization on a vector.

Methods Documentation

transform(vector)[source]#

Applies unit length normalization on a vector.

New in version 1.2.0.

Parameters

vectorpyspark.mllib.linalg.Vector or pyspark.RDD: vector or RDD of vector to be normalized.

Returns

pyspark.mllib.linalg.Vector or pyspark.RDD: normalized vector(s). If the norm of the input is zero, it will return the input vector.

RetroSearch is an open source project built by @garambo | Open a GitHub Issue

Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo

HTML: 3.2 | Encoding: UTF-8 | Version: 0.7.4