
本文旨在解决将一维 NumPy 数组重塑为尽可能接近正方形的二维矩阵的问题。由于并非所有数字都能完美分解为两个相等的整数,因此我们需要找到两个因子,它们的乘积等于数组的长度,并且这两个因子尽可能接近。本文将介绍两种实现此目标的 Python 代码方法,并提供代码示例和使用注意事项,帮助读者理解和应用这些方法。
在数据处理和科学计算中,经常需要将数据重塑为不同的形状以适应特定的算法或分析需求。当需要将一维 NumPy 数组转换为二维矩阵时,如果目标是创建一个尽可能接近正方形的矩阵,就需要找到两个因子,它们的乘积等于数组的长度,并且这两个因子尽可能接近。
以下介绍两种方法来实现这个目标。
方法一:快速方法
这种方法适用于相对较小的 n 值,它通过遍历小于等于 n 平方根的整数,找到 n 的因子。
import numpy as np
from math import isqrt
def np_squarishrt(n):
a = np.arange(1, isqrt(n) + 1, dtype=int)
b = n // a
i = np.where(a * b == n)[0][-1]
return a[i], b[i]
# 示例
a = np.arange(500)
rows, cols = np_squarishrt(len(a))
b = a.reshape((rows, cols))
print(b.shape) # 输出 (20, 25)代码解释:
- np_squarishrt(n) 函数接收一个整数 n 作为输入,目标是找到两个整数 p 和 q,使得 p * q == n 并且 p 和 q 尽可能接近。
- a = np.arange(1, isqrt(n) + 1, dtype=int) 创建一个从 1 到 n 的整数平方根的 NumPy 数组。
- b = n // a 计算 n 除以 a 中每个元素的整数除法结果,并将结果存储在数组 b 中。
- i = np.where(a * b == n)[0][-1] 找到 a 和 b 中元素相乘等于 n 的索引,并选择最后一个索引。
- return a[i], b[i] 返回找到的两个因子。
- 最后,使用 reshape 函数将原始数组重塑为计算出的形状。
注意事项:
- 此方法在 n 较大时可能效率较低,因为它需要遍历一定范围内的整数。
- isqrt 函数用于计算整数的平方根,避免使用浮点数。
方法二:通用方法
这种方法使用因式分解和幂集组合来找到最接近的因子。
import numpy as np
from itertools import chain, combinations
from math import isqrt
def factors(n):
while n > 1:
for i in range(2, n + 1):
if n % i == 0:
n //= i
yield i
break
def uniq_powerset(iterable):
"""
Similar to powerset(it) but without repeats.
uniq_powerset([1,1,2]) --> (), (1,), (2,), (1, 1), (1, 2), (1, 1, 2)
"""
s = list(iterable)
return chain.from_iterable(set(combinations(s, r)) for r in range(len(s)+1))
def squarishrt(n):
p = isqrt(n)
if p**2 == n:
return p, p
bestp = 1
f = list(factors(n))
for t in uniq_powerset(f):
if 2 * len(t) > len(f):
break
p = np.prod(t) if t else 1
q = n // p
if p > q:
p, q = q, p
if p > bestp:
bestp = p
return bestp, n // bestp
# 示例
a = np.arange(500)
b = a.reshape(squarishrt(len(a)))
print(b.shape)代码解释:
- factors(n) 函数使用埃拉托斯特尼筛法找到 n 的所有质因数。
- uniq_powerset(iterable) 函数生成输入迭代器中所有元素的唯一组合(幂集)。
- squarishrt(n) 函数首先检查 n 是否是完全平方数。如果是,则返回平方根。否则,它找到 n 的所有质因数,并使用 uniq_powerset 函数生成这些因数的唯一组合。然后,它遍历所有组合,找到两个因子 p 和 q,它们的乘积等于 n 并且 p 尽可能接近 n 的平方根。
- 最后,使用 reshape 函数将原始数组重塑为计算出的形状。
注意事项:
- 此方法比第一种方法更通用,但计算成本更高,因为它需要计算因式分解和幂集。
- uniq_powerset 函数用于避免重复组合,从而提高效率。
- 此方法可以找到最接近正方形的因子,即使 n 的质因数分解比较复杂。
总结
本文介绍了两种将一维 NumPy 数组重塑为接近正方形的二维矩阵的方法。第一种方法适用于相对较小的 n 值,而第二种方法更通用,但计算成本更高。选择哪种方法取决于具体的需求和性能考虑。在实际应用中,可以根据数组的大小和所需的精度来选择最合适的方法。










