发布时间:2023-01-20 12:00
许多 R 包中含有数据集,可以通过data
函数查看或加载这些数据集,通过?
获得数据集的帮助文档。
基本包 datasets
含有 100 多个数据集(R version 4.2.0),涉及医学、自然、社会学等各个领域。
查看一下:
library(knitr)
library(tidyverse)
pkg = data(package = "datasets")
as_tibble(pkg$results[, c('Item', 'Title')])
## # A tibble: 104 × 2
## Item Title
##
## 1 AirPassengers Monthly Airline Passenger Numbers 1949-1960
## 2 BJsales Sales Data with Leading Indicator
## 3 BJsales.lead (BJsales) Sales Data with Leading Indicator
## 4 BOD Biochemical Oxygen Demand
## 5 CO2 Carbon Dioxide Uptake in Grass Plants
## 6 ChickWeight Weight versus age of chicks on different diets
## 7 DNase Elisa assay of DNase
## 8 EuStockMarkets Daily Closing Prices of Major European Stock Indices,…
## 9 Formaldehyde Determination of Formaldehyde
## 10 HairEyeColor Hair and Eye Color of Statistics Students
## # … with 94 more rows
datasets
中的数据集在 R 启动时已经自动加载到环境中了,可以直接使用,例如:
head(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
查看iris
的帮助文档:
?iris
使用其他包的数据集,需要先加载包,再加载数据集。这里以ggplot2
包举例:
library(ggplot2)
data(diamonds)
head(diamonds)
## # A tibble: 6 × 10
## carat cut color clarity depth table price x y z
##
## 1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43
## 2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31
## 3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31
## 4 0.29 Premium I VS2 62.4 58 334 4.2 4.23 2.63
## 5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75
## 6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48
实际上,当library(ggplot2)
执行后,其中的数据集如diamonds
,mpg
等已经可用了,无需显式加载。
但是有些包library
后数据集还不可用,则需要用data
函数显式加载。
data(package = "package_name"),查看 R 包里有哪些数据集
data(dataset_name),加载数据集
?dataset_name,查看数据集的帮助文档
【vue-treeselect+vxe-table】数据量大的时候懒加载,数据回显,输入框绑值,末级节点不要前面的箭头等问题详解
视频教程-基于springboot2.x+layui+shiro+redis整合前后端分离的权限管理系统-Java
软件测试工程师涨薪攻略,1年多经验的测试从月薪8k-17k的转变
03_Linux基础-文件类型-主辅提示符-第1提示符-Linux命令-内外部命令-快捷键-改为英文编码-3个时间-stat-其他基础命令
卷到自己?继 Imagen 之后,推出200 亿文本生成的图像模型惊呆网友!
1人工智能概述------机器学习算法分类 (监督学习、回归问题、分类问题、无监督学习、半监督学习、强化学习)
python语言基础(十一)面向对象编程(类、对象、self参数、init方法、str方法、私有属性、私有方法)
c语言c 语言基本知识,学好c语言必读,c语言的基本知识点总结