excel学习库

excel表格_excel函数公式大全_execl从入门到精通

BIOM、txt、csv和xlsx格式的数据导入R

简介:

本节介绍几种常见的数据格式应该如何导入R语言。

无论是什么格式的数据首先要做的是告诉R你的工作路径,或者你工作的文件夹的路径是什么。有很多方式可以做到这一点,这里我只介绍一种。代码如下:

setwd(choose.dir())#选择工作路径

输入以上代码然后快捷键“ctrl+enter”就会弹出选择工作路径的窗口,选择数据所在的“工作盘(如E盘,D盘等)”和对应的“文件夹”点击确定即可。

1、导入txt格式数据

rm(list = ls())#清理当前环境

#txt格式的数据导入

dat_txt <- read.table("1-bac.txt",sep = '\t',header=T,check.names = FALSE, row.names=1)

head(dat_txt[,1:6])#查看前6行和前6列数据

2、导入csv格式数据

#csv格式的数据导入

dat_csv <- read.csv("1-bac.csv",header=T,sep=",",row.names = 1)

head(dat_csv[,1:6])#查看前6行和前6列数据

3、导入xlsx格式数据

#xlsx格式的数据导入

#xlsx格式的数据需要用到"readxl"安装包

#若没有需要使用install.packages("readxl")下载之后再加载

install.packages("readxl")

library(readxl)

dat_xlsx <- read_excel("1-bac.xlsx",sheet = 1,col_names = T)

head(dat_xlsx[,1:6])

#其中sheet=1表示xlsx文件中的第几个sheet;在本示例中sheet2为分类信息,

#若想导入则代码修改为如下:

dat_xlsx2 <- read_excel("1-bac.xlsx",sheet = 2,col_names = T)

head(dat_xlsx2[,1:6])

4、导入biom格式数据

什么是biom数据?

Biom数据是一种生物矩阵数据,类似于xlsx数据(这种表述虽然不太准确但是更容易理解)和list格式的数据它同时包含了“测序数据”、“分类信息”和“tree”等信息。这种格式的数据是一种高度压缩的数据,便于数据的传输和交流。一般使用测序平台(如QIIME 2)产生这类格式的数据,也可以使用R语言生成该格式的数据。

该类格式的数据虽然可以在R语言中进行分析但是很依赖电脑的配置(主要是电脑运存)。像我给出的例子“1-emp.biom”尽管只有38M,但是导入R解压后有9.4GB;所以如果电脑运存过小则可能在导入时直接报错。

#导入biom数据

#若想使用R导入biom数据需要下载相应的安装包,代码如下:

devtools::install_github("joey711/biomformat")

#若以上代码报错,检查是否下载了devtools包,若没有则需先下载该包再运行以上代码

library(biomformat)

dat.b<-read_biom("1-emp.biom")

show(dat.b)#展示数据格式和规模

biom_shape(dat.b)#数据的规模

otu_info<-observation_metadata(dat.b)#物种分类信息

otu<-biom_data(dat.b)#OTU 测序数据

#rownames(otu)#行名称

#rownames(otu_info)#行名称

otu<-otu[rownames(otu_info),]#按照otu_info重新对otu排序

otu1<-data.matrix(otu)

bac<-cbind(otu1[1:1000,],otu_info[1:1000,])#包含测序数据和分类信息的前1000条outs数据

write.csv(bac,"1-bac.csv")#导出数据

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接