numpy修改数组到位?

发布于 2021-01-29 19:24:15

我有以下代码试图对m x n数组的值进行规范化(它将用作神经网络的输入,其中m,训练示例n的数量和特征的数量)。

但是,当脚本运行后在解释器中检查数组时,我看到值未标准化;因此,请参见图9。也就是说,它们仍然具有原始值。我猜这是因为对array函数内部变量的赋值仅在函数内部可见。

我该如何进行规范化?还是我必须从normalize函数返回一个新数组?

import numpy

def normalize(array, imin = -1, imax = 1):
    """I = Imin + (Imax-Imin)*(D-Dmin)/(Dmax-Dmin)"""

    dmin = array.min()
    dmax = array.max()

    array = imin + (imax - imin)*(array - dmin)/(dmax - dmin)
    print array[0]


def main():

    array = numpy.loadtxt('test.csv', delimiter=',', skiprows=1)
    for column in array.T:
        normalize(column)

    return array

if __name__ == "__main__":
    a = main()
关注者
0
被浏览
48
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    如果你想数学运算适用于就地一个numpy的数组,你可以简单地使用标准就地运营商+=-=/=等,因此,例如:

    >>> def foo(a):
    ...     a += 10
    ... 
    >>> a = numpy.arange(10)
    >>> a
    array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
    >>> foo(a)
    >>> a
    array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])
    

    这些操作的就地版本启动起来有点快,特别是对于较大的阵列:

    >>> def normalize_inplace(array, imin=-1, imax=1):
    ...         dmin = array.min()
    ...         dmax = array.max()
    ...         array -= dmin
    ...         array *= imax - imin
    ...         array /= dmax - dmin
    ...         array += imin
    ...     
    >>> def normalize_copy(array, imin=-1, imax=1):
    ...         dmin = array.min()
    ...         dmax = array.max()
    ...         return imin + (imax - imin) * (array - dmin) / (dmax - dmin)
    ... 
    >>> a = numpy.arange(10000, dtype='f')
    >>> %timeit normalize_inplace(a)
    10000 loops, best of 3: 144 us per loop
    >>> %timeit normalize_copy(a)
    10000 loops, best of 3: 146 us per loop
    >>> a = numpy.arange(1000000, dtype='f')
    >>> %timeit normalize_inplace(a)
    100 loops, best of 3: 12.8 ms per loop
    >>> %timeit normalize_copy(a)
    100 loops, best of 3: 16.4 ms per loop
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看