Python

重塑n维数组的视图而无需使用重塑

发布于 2021-01-29 15:05:53

tl; dr是否 可以在不使用numpy.reshape的情况下将numpy数组的视图从5x5x5x3x3x3重塑为125x1x1x3x3x3？

我想对一个体积（大小为MxMxM）执行一个滑动窗口操作（具有不同的步幅）。如本杰明（Benjamin）和艾肯伯格（Eickenberg）numpy.lib.stride_tricks.as_strided先前建议的那样，可以使用生成滑动窗口数组，并在下面的代码片段中进行了演示，该代码片段使用了skimage中的helper方法，该方法使用。as_strided

此辅助方法的输出为我提供了NxNxNxnxnxn的形状，但我希望该形状为N ^
3x1xnxnxn。虽然我可以使用np.reshape来实现此目的，但是如果体积变大（>
100x100x100），np.reshape就会变慢，我不确定为什么。我以为可以使用as_stride重塑输出，但是numpy崩溃了（下面的代码段）。关于如何在不使用np.reshape的情况下如何从helper方法获得输出的任何想法N
** 3x1xnxnxn？

import numpy as np
import skimage
l = 15
s = 3
X = np.ones((l,l,l))      
print('actual shape',X.shape)
view = skimage.util.shape.view_as_blocks(X,(s,s,s))    
print('original view',view.shape)

new_shape = ((l/s)**3,1,1,s,s,s)
print('new view',new_shape)

view_correct = view.reshape(new_shape)
print(view_correct.shape)
print('coord:','124,0,0,2,2,2','value:',view_correct[124,0,0,2,2,2])

view_incorrect = np.lib.stride_tricks.as_strided(view, shape=new_shape)
print(view_incorrect.shape)
print('coord:','124,0,0,2,2,2','value:',view_incorrect[124,0,0,2,2,2])

关注者

被浏览

100

1 个回答

面试哥 2021-01-29

为面试而生，有面试问题，就找面试哥。

我从中举了一个例子view_as_blocks，并尝试了您的重塑风格：

A = np.arange(4*4).reshape(4,4)
B = view_as_blocks(A, block_shape=(2, 2))
print(A.__array_interface__)
print(B.__array_interface__)

C = B.reshape((2*2,2,2))
print(C.__array_interface__)

生产：

{'typestr': '<i4', 'data': (153226600, False), 'shape': (4, 4),
 'descr': [('', '<i4')], 'version': 3, 'strides': None}
{'typestr': '<i4', 'data': (153226600, False), 'shape': (2, 2, 2, 2),
 'descr': [('', '<i4')], 'version': 3, 'strides': (32, 8, 16, 4)}
{'typestr': '<i4', 'data': (150895960, False), 'shape': (4, 2, 2),
 'descr': [('', '<i4')], 'version': 3, 'strides': None}

在data用于指针A和B是相同的; B是对的看法A。

但是指向的指针C是不同的。它是副本。这就解释了为什么需要这么长时间。

让我们做一些不同的事情：

A = np.arange(4*4).reshape(4,4)
B = view_as_blocks(A, block_shape=(2, 2))
print(A.__array_interface__)
print(B.__array_interface__)

C = B.reshape((2*2,1,2,2))
print(C.__array_interface__)

D = as_strided(B, shape=(2*2,1,2,2))
print(D.__array_interface__)

print(B[1,1,:,:])
print(C[3,0,:,:])
print(D[3,0,:,:])

生产

1254:~/mypy$ python3 skshape.py 
{'strides': None, 'typestr': '<i4', 'version': 3, 
 'data': (154278744, False), 'shape': (4, 4), 'descr': [('', '<i4')]}
{'strides': (32, 8, 16, 4), 'typestr': '<i4', 'version': 3, 
 'data': (154278744, False), 'shape': (2, 2, 2, 2), 'descr': [('', '<i4')]}
{'strides': None, 'typestr': '<i4', 'version': 3, 
 'data': (155705400, False), 'shape': (4, 1, 2, 2), 'descr': [('', '<i4')]}
{'strides': (32, 8, 16, 4), 'typestr': '<i4', 'version': 3, 
 'data': (154278744, False), 'shape': (4, 1, 2, 2), 'descr': [('', '<i4')]}

[[10 11]
 [14 15]]
[[10 11]
 [14 15]]
[[  154561960 -1217783696]
 [         48        3905]]

再次重塑会创建一个副本。第二个as_strides返回一个视图，但跨度被拧紧。它正在查看原始数据缓冲区之外的内存（这就是为什么自己大步走很危险的部分原因）。

在我的示例中，查看每个块的第一个角值

print(B[:,:,0,0])
print(C[:,0,0,0])

[[ 0  2]
 [ 8 10]]
[ 0  2  8 10]

对于B，行增加8，列增加2；这反映在(32,8)（4 * 8,4 * 2）步幅上。

但是C步骤是（2,6,2）-大步前进无法做到。

由此我得出结论，没有复制就不可能进行重塑。

知识点

Python

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦

去下载看看