使用 SciPy 进行数据分析

SciPy 是一个Python库，可用于求解许多数学方程和算法。它是在 Numpy 库的顶部设计的，可以更多地扩展查找科学数学公式，如矩阵秩、逆、多项式方程、LU 分解等。使用其高级函数将显着降低代码的复杂性并有助于更好地分析数据。 SciPy 是一个交互式Python会话，用作数据处理库，旨在与 MATLAB、Octave、R-Lab 等竞争对手竞争。它具有许多用户友好、高效且易于使用的功能，有助于解决数值积分、插值、优化、线性代数和统计等问题。

在创建 ML 模型的同时在Python中使用 SciPy 库的好处在于，它还提供了一种强大的编程语言，可用于开发不太复杂的程序和应用程序。

# import numpy library
import numpy as np
A = np.array([[1,2,3],[4,5,6],[7,8,8]])

线性代数

矩阵的行列式

# importing linalg function from scipy
from scipy import linalg
  
# Compute the determinant of a matrix
linalg.det(A)

Output :
2.999999999999997

计算矩阵的旋转 LU 分解
LU分解是一种将矩阵简化为组成部分的方法，有助于更轻松地计算复杂的矩阵运算。分解方法也称为矩阵分解方法，是计算机中线性代数的基础，甚至适用于求解线性方程组、计算逆矩阵和计算矩阵行列式等基本运算。
分解是：
A = PLU
其中 P 是置换矩阵，L 是具有单位对角元素的下三角矩阵，U 是上三角矩阵。

P, L, U = linalg.lu(A)
print(P)
print(L)
print(U)
# print LU decomposition
print(np.dot(L,U))

Output :
array([[ 0.,  1.,  0.],
       [ 0.,  0.,  1.],
       [ 1.,  0.,  0.]])

array([[ 1.        ,  0.        ,  0.        ],
       [ 0.14285714,  1.        ,  0.        ],
       [ 0.57142857,  0.5       ,  1.        ]])

array([[ 7.        ,  8.        ,  8.        ],
       [ 0.        ,  0.85714286,  1.85714286],
       [ 0.        ,  0.        ,  0.5       ]])

array([[ 7.,  8.,  8.],
       [ 1.,  2.,  3.],
       [ 4.,  5.,  6.]])

该矩阵的特征值和特征向量

eigen_values, eigen_vectors = linalg.eig(A)
print(eigen_values)
print(eigen_vectors)

Output :
array([ 15.55528261+0.j,  -1.41940876+0.j,  -0.13587385+0.j])

array([[-0.24043423, -0.67468642,  0.51853459],
       [-0.54694322, -0.23391616, -0.78895962],
       [-0.80190056,  0.70005819,  0.32964312]])

也可以求解线性方程组

v = np.array([[2],[3],[5]])
print(v)
s = linalg.solve(A,v)
print(s)

Output :
array([[2],
       [3],
       [5]])

array([[-2.33333333],
       [ 3.66666667],
       [-1.        ]])

稀疏线性代数

SciPy 有一些用于计算稀疏和可能非常大的矩阵的例程。必要的工具在子模块 scipy.sparse 中。
让我们看看如何构造一个大的稀疏矩阵：

# import necessary modules
from scipy import sparse
# Row-based linked list sparse matrix
A = sparse.lil_matrix((1000, 1000))
print(A)
  
A[0,:100] = np.random.rand(100)
A[1,100:200] = A[0,:100]
A.setdiag(np.random.rand(1000))
print(A)

Output :
<1000x1000 sparse matrix of type ''
    with 0 stored elements in LInked List format>

<1000x1000 sparse matrix of type ''
    with 1199 stored elements in LInked List format>

稀疏矩阵的线性代数

from scipy.sparse import linalg
  
# Convert this matrix to Compressed Sparse Row format.
A.tocsr()
  
A = A.tocsr()
b = np.random.rand(1000)
ans = linalg.spsolve(A, b)
# it will print ans array of 1000 size
print(ans)

Output :
array([-2.53380006e+03, -1.25513773e+03,  9.14885544e-01,  2.74521543e+00,
        5.99942835e-01,  4.57778093e-01,  1.87104209e-01,  2.15228367e+00,
        8.78588432e-01,  1.85105721e+03,  1.00842538e+00,  4.33970632e+00,
        5.26601699e+00,  2.17572231e-01,  1.79869079e+00,  3.83800946e-01,
        2.57817130e-01,  5.18025462e-01,  1.68672669e+00,  3.07971950e+00,
        6.20604437e-01,  1.41365890e-01,  3.18167429e-01,  2.06457302e-01,
        8.94813817e-01,  5.06084834e+00,  5.00913942e-01,  1.37391305e+00,
        2.32081425e+00,  4.98093749e+00,  1.75492222e+00,  3.17278127e-01,
        8.50013844e-01,  1.17524493e+00,  1.70173722e+00,  .............))

一体化

当一个函数很难解析积分时，只需通过数值积分方法找到一个解决方案。 SciPy 也有能力进行数值积分。 Scipy 在scipy.integrate模块中有集成方法。

单积分
Quad 例程是 SciPy 集成函数中的重要函数。如果在 x 范围从 a 到 b 的 f(x)函数中进行积分，则积分看起来像这样。

quad的参数是scipy.integrate.quad(f, a, b)，其中'f'是要积分的函数。而 'a' 和 'b' 是 x 限制的下限和上限。让我们看一个整合的例子相对于 dx 在 0 和 1 的范围内。
我们将首先定义函数f(x)=e^(-x^2) ，这是使用 lambda 表达式完成的，然后使用 quad 例程。
```
import scipy.integrate
f= lambda x:np.exp(-x**2)
# print results
i = scipy.integrate.quad(f, 0, 1)
print(i)
```
```
(0.7468241328124271, 8.291413475940725e-15)
```
quad函数返回两个值，其中第一个数字是 integer 的值，第二个值是 integer 值的可能误差。
双积分
dblquad函数的参数是scipy.integrate.dblquad(f, a, b, g, h) 。其中，'f'是要积分的函数，'a'和'b'分别是x变量的下限和上限，而'g'和'h'是告诉下限和上限的函数y 变量。
例如，让我们在 x 范围从 0 到 2 和 y 范围从 0 到 1 上执行 x*y^2 的二重积分。

我们使用 lambda 表达式定义函数 f、g 和 h。请注意，即使 g 和 h 是常数（在许多情况下可能是常数），它们也必须定义为函数，正如我们在此处为下限所做的那样。
```
from scipy import integrate
f = lambda y, x: x*y**2
i = integrate.dblquad(f, 0, 2, lambda x: 0, lambda x: 1)
# print the results
print(i)
```
```
Output :
 (0.6666666666666667, 7.401486830834377e-15)
```

SciPy 还可以做很多事情，例如傅里叶变换、贝塞尔函数等。
您可以参考文档以获取更多详细信息！