发布时间:2023-11-16 08:30
sklearn之datasets
sklearn.datasets模块提供了导入、在线下载及本地生成数据集的付费,通过dir或help命令查看:
(1)datasets.load_
datasets.load_iris() # 鸢尾花数据集
datasets.load_boston() # 波士顿房价数据集
datasets.load_breast_cancer() # 乳腺癌数据集
datasets.load_diabets() # 糖尿病数据集
datasets.load_digits() # 手写体数字数据集
datasets.load_linnerud() # 手写体数字数据集
这些数据集都可以在官网上查到,以鸢尾花为例,可以在官网上找到demo: http://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html
numpy.ndarray 数组
from sklearn import datasets
import matplotlib.pyplot as plt
# 加载数据集
iris=datasets.load_iris()
print(iris.data)
print(iris.feature_names)
print(iris.target)
print(iris.target_names)
print(iris.DESCR)
X=iris.data[:,:2]
y=iris.target
# 画图
plt.figure(figsize=(12,8))
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.Set1)
plt.xlabel("sepal length (cm)")
plt.ylabel("sepal width (cm)")
plt.show()
(2) datasets.fetch_
可以通过设置环境变量SCIKIT_LEARN_DATA修改路径
datasets.get_data_home() 获取下载路径
(3) 计算机生成的数据集:sklearn.datasets.make_
(4) svmlight/libsvm格式的数据集: sklearn.datasets.load_svmlight_file()
(5) 购买了data.org 在线下载获取的数据集: sklearn.datasets.fetch_mldata()
国内首次!这家中国企业的语言AI实力被公认全球No.2!仅次于谷歌
Java Springboot项⽬部署到linux任意文件夹或tomcat,并使用nginx实现域名访问
业务系统兼容数据库Oracle/PostgreSQL(openGauss)/MySQL的琐事
python相机标定流程图_相机标定——OpenCV-Python Tutorials
Content type ‘application/x-www-form-urlencoded;charset=UTF-8‘ not supported“【已解决】