Python

numpy：按多维数组对多维数组进行排序

发布于 2021-01-29 18:08:18

请原谅我这是多余的还是超基本的。我要从R进入Python / Numpy，并且很难在脑海里翻转事物。

我有一个维数组，我想使用索引值的另一个n维数组进行排序。我知道我可以将其包装成一个循环，但是似乎应该有一种非常简洁的Numpyonic方式将其击败并提交。这是设置n
= 2的问题的示例代码：

a1 = random.standard_normal(size=[2,5]) 
index = array([[0,1,2,4,3] , [0,1,2,3,4] ])

所以现在我有一个2 x 5的随机数数组和2 x 5的索引。我已经阅读了take()约10次帮助，但显然我的大脑并没有感到沮丧。

我以为这可以带我到那里：

take(a1, index)

array([[ 0.29589188, -0.71279375, -0.18154864, -1.12184984,  0.25698875],
       [ 0.29589188, -0.71279375, -0.18154864,  0.25698875, -1.12184984]])

但这显然只是对第一个元素重新排序（我认为是由于展平）。

关于如何从我所处位置到将a1的元素0按索引…元素n的元素0排序的解决方案的任何提示？

关注者

被浏览

155

1 个回答

面试哥 2021-01-29

为面试而生，有面试问题，就找面试哥。
~~我还没有想到如何在N维中进行此操作，但这~~ 是2D版本：
```
>>> a = np.random.standard_normal(size=(2,5))
>>> a
array([[ 0.72322499, -0.05376714, -0.28316358,  1.43025844, -0.90814293],
       [ 0.7459107 ,  0.43020728,  0.05411805, -0.32813465,  2.38829386]])
>>> i = np.array([[0,1,2,4,3],[0,1,2,3,4]]) 
>>> a[np.arange(a.shape[0])[:,np.newaxis],i]
array([[ 0.72322499, -0.05376714, -0.28316358, -0.90814293,  1.43025844],
       [ 0.7459107 ,  0.43020728,  0.05411805, -0.32813465,  2.38829386]])
```
这是N维版本：
```
>>> a[list(np.ogrid[[slice(x) for x in a.shape]][:-1])+[i]]
```
运作方式如下：

好的，让我们从3维数组开始进行说明。
```
>>> import numpy as np
>>> a = np.arange(24).reshape((2,3,4))
>>> a
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])
```
您可以通过沿每个轴指定索引来访问此数组的元素，如下所示：
```
>>> a[0,1,2]
6
```
这等效于a[0][1][2]如果我们要处理列表而不是数组，您将如何访问同一元素。

切片数组时，Numpy可以使您变得更加幻想：
```
>>> a[[0,1],[1,1],[2,2]]
array([ 6, 18])
>>> a[[0,1],[1,2],[2,2]]
array([ 6, 22])
```
这些例子就等于[a[0][1][2],a[1][1][2]]和[a[0][1][2],a[1][2][2]]如果我们处理列表。

您甚至可以省去重复的索引，而numpy会找出您想要的内容。例如，以上示例可以等效地编写：
```
>>> a[[0,1],1,2]
array([ 6, 18])
>>> a[[0,1],[1,2],2]
array([ 6, 22])
```
在每个维度中切片的数组（或列表）的形状仅影响返回数组的形状
。换句话说，numpy不在乎您是否在尝试(2,3,4)拉取值时尝试使用形状数组来索引数组，只是它会反馈形状数组(2,3,4)。例如：
```
>>> a[[[0,0],[0,0]],[[0,0],[0,0]],[[0,0],[0,0]]]
array([[0, 0],
       [0, 0]])
```
在这种情况下，我们a[0,0,0]一遍又一遍地抓取相同的元素，但是numpy返回的数组与传入的形状相同。

好的，解决您的问题。您想要的是沿最后一个轴用index数组中的数字索引数组。因此，对于您问题中的示例，您希望[[a[0,0],a[0,1],a[0,2],a[0,4],a[0,3]],a[1,0],a[1,1],...

正如我前面所说，索引数组是多维的，这一事实并不能告诉numpy有关从何处提取这些索引的任何信息。它只是指定输出数组的形状。因此，在您的示例中，您需要告诉numpy，要从中提取前5个值，而从中提取a[0]后5个值a[1]。简单！
```
>>> a[[[0]*5,[1]*5],index]
```
它在N维中变得复杂，但让我们对a我上面定义的3维数组进行处理。假设我们有以下索引数组：
```
>>> i = np.array(range(4)[::-1]*6).reshape(a.shape)
>>> i
array([[[3, 2, 1, 0],
        [3, 2, 1, 0],
        [3, 2, 1, 0]],

       [[3, 2, 1, 0],
        [3, 2, 1, 0],
        [3, 2, 1, 0]]])
```
因此，这些值全部用于沿最后一个轴的索引。我们需要告诉numpy这些数字将沿第一和第二轴取哪些索引；即我们需要告诉numpy第一个轴的索引是：
```
i1 = [[[0, 0, 0, 0],
       [0, 0, 0, 0],
       [0, 0, 0, 0]],

      [[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]]]
```
第二轴的索引为：
```
i2 = [[[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]],

      [[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]]]
```
然后我们可以这样做：
```
>>> a[i1,i2,i]
array([[[ 3,  2,  1,  0],
        [ 7,  6,  5,  4],
        [11, 10,  9,  8]],

       [[15, 14, 13, 12],
        [19, 18, 17, 16],
        [23, 22, 21, 20]]])
```
方便的numpy函数，它生成i1并i2称为np.mgrid。我np.ogrid在答案中使用了这种方法，在这种情况下，这是等效的，因为我之前谈到过麻木的魔术。

希望有帮助！

知识点

Python

面圈网VIP题库全新上线，海量真题题库资源。 90大类考试，超10万份考试真题开放下载啦

去下载看看