📅  最后修改于: 2023-12-03 15:18:44.518000             🧑  作者: Mango
在 PyBrain 中,监督数据集是用于训练和测试网络的常用数据集格式。通常,输入和输出数据都是成对出现的,并用于指导神经网络学习正确的模式。
PyBrain 支持多种监督数据集类型,包括:
创建一个监督数据集很简单。以下是一个示例:
from pybrain.datasets import SupervisedDataSet
# 创建一个 SupervisedDataSet
input_size = 2
output_size = 1
ds = SupervisedDataSet(input_size, output_size)
# 添加数据
ds.addSample((0, 0), (0,))
ds.addSample((0, 1), (1,))
ds.addSample((1, 0), (1,))
ds.addSample((1, 1), (0,))
在此示例中,我们创建了一个 SupervisedDataSet,并向其中添加了四个输入和输出值。input_size 和 output_size 分别指定输入和输出的大小。addSample() 方法用于将每个输入和输出值对添加到数据集中。
PyBrain 还提供了一些实用程序方法,可用于从文件或数据库中加载现有的监督数据集。以下是一个示例:
from pybrain.datasets import ClassificationDataSet
from pybrain.datasets import dataset
# 加载数据集
filename = 'my_dataset.csv'
ds = ClassificationDataSet.loadFromFile(filename, target='output')
在此示例中,我们使用 ClassificationDataSet 类从文件中加载数据集。loadFromFile() 方法用于按指定格式从文件中加载数据集。target 参数指定了输出类别标签名称。同样,PyBrain 还提供了可用于从数据库中加载数据集的方法。