上节课我们讲述了用于 ndarray 的文件操作。 image.png 本节课我们来讲述 ndarray 的赋值、视图、拷贝和广播。

# 1.赋值

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1

print(my_arr2 is my_arr1)
1
2
3
4
5
6

在上面的代码中,将 my_arr1 赋值给 my_arr2,这时不会创建新的数组对象,只是多了一个引用,my_arr1my_arr2 是同一个数组的两个名字。当我们改变 my_arr2 的形状时,my_arr1 的形状也会跟着改变,例如:

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1

my_arr2.shape = (2, 3)

print(my_arr2)
print(my_arr1)
1
2
3
4
5
6
7
8
9

上面的代码中,my_arr2 的形状改变后,my_arr1 的形状也发生了相应的改变。

# 2.视图

视图方法可以实现不同的数组对象共享同样的数据。例如:

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1.view()

print(my_arr2 is my_arr1)
print(my_arr2.base is my_arr1)
print(my_arr2.flags.owndata)
1
2
3
4
5
6
7
8

从上述代码的输出可以看出,my_arr1my_arr2 是两个不同的对象,my_arr2my_arr1 的视图,my_arr2 没有自己的数据。当 my_arr2 的形状发生改变时,my_arr1 的形状并不会发生改变。但是,当 my_arr2 的数据发生改变时,my_arr1 会发生同样的改变。例如:

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1.view()

my_arr2.shape = (2, 3)

print(my_arr1.shape)
print(my_arr2.shape)

my_arr2[0, 1] = 10
print(my_arr1)
1
2
3
4
5
6
7
8
9
10
11
12

综上所述,我们可以得出视图相对于原来的数组来说,除了数据是共享的,其他都是独立的。另外,前面介绍的切片操作,得到的也是一个数组的视图。例如:

import numpy as np

my_arr1 = np.arange(6)
my_slice = my_arr1[2:4]
my_slice[:] = 10

print(my_arr1)
1
2
3
4
5
6
7

从上面的代码可以得出,当改变切片的数据时,原数组的数据也跟着进行了相应的改变。

# 3.拷贝

从上述内容可以看出,不管是赋值还是视图,对其中一个数组的改变都会影响另外一个。那么有没有一种方法使得两者互不干扰,答案是有的,那便是拷贝。copy() 方法会生成数组的一个完整的拷贝,包括其数据。例如:

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1.copy()

print(my_arr2 is my_arr1)
print(my_arr2.base is my_arr1)
1
2
3
4
5
6
7

从上述代码的输出可以看出,my_arr1my_arr2 是两个独立的数组。对其中一个数组中元素的改变不会影响另外一个数组:

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1.copy()

my_arr2[2] = 10

print(my_arr1)
print(my_arr2)
1
2
3
4
5
6
7
8
9

# 4.广播

广播(broadcasting)指的是不同形状的数组之间的算术运算的执行方式。它是一种非常强大的功能,但也容易令人误解,将标量值跟数组合并时就会发生最简单的广播,例如:

import numpy as np

my_arr1 = np.arange(6)
my_arr2 = my_arr1 * 6

print(my_arr2)
1
2
3
4
5
6

这里我们说,在这个乘法运算中,标量值 6 被广播到了其他所有的元素上。下面继续来看一个例子,我们可以通过减去列平均值的方式对数组的每一列进行距平化处理。这个问题解决起来非常简单,代码如下:

import numpy as np

my_arr1 = np.random.randn(4, 3)
demeaned = my_arr1 - my_arr1.mean(0)

print(demeaned)

print(demeaned.mean(0))
1
2
3
4
5
6
7
8

在上面的例子中,my_arr1.mean(0) 是一个 1 行 3 列的数组,当我们用一个 4 行 3 列的数组减去一个 1 行 3 列的数组时,便会对 1 行 3 列的数组进行广播。广播过程的图形化如下图所示: image.png

# 5.总结

image.png

# 6.练习题

通过 arange 函数创建一个 4*3 的 ndarray,并从此 4*3 的 ndarray 减去一个 1*3 的 ndarray,从中体会广播的操作。

更新于: 12/30/2021, 2:39:56 AM