numpy

numpy

numpy相关

1. 高维ndarray,报错:超出存储,如何解决?

​ 分块处理:将数据分成较小的块来处理,而不是一次性加载整个数据集。这样可以减少对内存的需求。

使用Dask并行计算库

import dask.array as da

# 创建一个 Dask 数组
data = da.random.random((5, 50, 300, 100, 30, 49), chunks=(1, 10, 100, 50, 10, 10))

# 对每个块进行处理
def process_block(block):
    # 在这里对块进行处理
    print(f"Processing block with shape {block.shape}")

# 使用 Dask 计算
data.map_blocks(process_block).compute()

使用Zarr

import zarr
import numpy as np

# 创建一个 Zarr 数组
data = zarr.zeros((5, 50, 300, 100, 30, 49), chunks=(1, 10, 100, 50, 10, 10), dtype=np.float64)

# 对每个块进行处理
def process_block(block):
    # 在这里对块进行处理
    print(f"Processing block with shape {block.shape}")

# 使用 Zarr 的块读取
for block in data.iter_chunks():
    process_block(block)

2. 产生随机数

# linspace
x1 = np.linspace(4, 13, sample_num) # 产生4-13范围内的sample_num个随机数

# random.randint
np.random.randint(0, m, 1)  # 产生0-m范围内的1个整数

3. ndarray拼接

x = np.concatenate(([x1], [x2]), axis=0) 

4. dot函数

np.dot(a,b) #a、b矩阵点乘

5. 数组多维转一维

ravel()、flatten()、squeeze()
ravel():		# 如果没有必要,不会产生源数据的副本
flatten():		# 返回源数据的副本
squeeze():		# 只能对维数为1的维度降维

6. reapeat函数

7. ndarray改变维度

a.reshape()
# 可以将数据的维度变化成想要的维度。
ndarray.reshape(x, y).astype(float)
# 再转为tensor

8. 滑动窗口

slide_arr1 = np.lib.stride_tricks.sliding_window_view(a1, # 原数组 3 # 窗口大小,也可以是元组,如(2,2) )

原文地址:https://www.cnblogs.com/systemTang/p/18949026