2021-03-08 18:01发布
[图]因平时用的是python,想把mat结尾的文件转为csv或者excel格式的,在网上搜了很多代码也运行不成功,想知道在matlab或者python中有什么简单快捷的方法可以实现这一操作吗?非常感谢各路... 显示全部
因平时用的是python,想把mat结尾的文件转为csv或者excel格式的,在网上搜了很多代码也运行不成功,想知道在matlab或者python中有什么简单快捷的方法可以实现这一操作吗?
非常感谢各路大神们!!!
1.CSV文件格式简介
逗号分隔值(Comma-SeparatedValues,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
CSV文件格式的通用标准并不存在,但是在RFC4180中有基础性的描述。使用的字符编码同样没有被指定,但是7-bitASCII是最基本的通用编码。
一般情况下,CSV文件格式规则如下:
1. 开头是不留空,以行为单位。
2. 可含或不含列名,含列名则居文件第一行。
3. 一行数据不跨行,无空行。
4. 以半角逗号(即,)作分隔符,列为空也要表达其存在。
5. 列内容如存在半角逗号(即,)则用半角双引号(即"")将该字段值包含起来。
6. 列内容如存在半角引号(即")则应替换成半角双引号("")转义,并用半角引号(即"")将该字段值包含起来。
7. 文件读写时引号,逗号操作规则互逆。
8. 内码格式不限,可为ASCII、Unicode或者其他。
9. 不支持特殊字符
2.Mat矩阵数据存储到CSV文件中
博文“C++读写CSV文件”提出了一种CSV文件的读取遍历算法和写入算法,http://www.cnblogs.com/snake-hand/p/3170483.html,并利用C++实现了对CSV文件的读、写操作。
本文结合OpenCV的CSV风格格式化输出与流缓冲重定向,比较巧妙地实现了“将Mat矩阵数据存储到CSV文件”功能。
代码如下:
//保存cout流缓冲区指针
streambuf*coutBuf=cout.rdbuf();
fstreammatData("E:\\Test\\data\\fire_2.csv",ios::out|ios::trunc);
if(!matData){
cerr<<"Fileopenorcreateerror!"<
exit(1);
}
//获取文件fire.csv的流缓冲区指针
streambuf*fileBuf=matData.rdbuf();
//设置cout流缓冲区指针为文件的流缓冲区指针
cout.rdbuf(fileBuf);
cout<
matData.flush();
matData.close();
//恢复cout原来的流缓冲区指针
cout.rdbuf(coutBuf);
测试结果:
3.从CSV文件读取数据到Mat矩阵
以下代码为我自己写的read_csv函数,实现了从CSV文件读取数据到Mat矩阵中的功能。
/**
*函数功能:将csv文件数据提取到Mat类型矩阵中
*输入:filepath文件路径数组指针;img_sizeMat类型数据的Size;img_typeMat类型数据的类型(32FC1)
*返回值:Mat矩阵
*/
Matread_csv(constchar*filepath,Sizeimg_size,intimg_type)
{
Matimage;
image.create(img_size,img_type);
stringpixel;
ifstreamfile(filepath,ifstream::in);
if(!file)
cout<<"CSVreadfail"<
intnl=image.rows;//numberoflines
intnc=image.cols;//numberofcolumns
inteolElem=image.cols-1; //每行最后一个元素的下标
intelemCount=0;
if(image.isContinuous())
nc=nc*nl;//thennopaddedpixels
nl=1; //itisnowa1Darray
for(inti=0;i
float*data=(float*)image.ptr(i);
for(intj=0;j
if(elemCount==eolElem){
getline(file,pixel,''); //任意地读入,直到读到delim字符'',delim字符不会被放入buffer中
data[j]=(float)atof(pixel.c_str()); //将字符串str转换成一个双精度数值并返回结果
elemCount=0; //计数器置零
else{
getline(file,pixel,','); //任意地读入,直到读到delim字符','delim字符不会被放入buffer中
elemCount++;
returnimage;
注意事项:
注意每一个记录结束时以’’结尾,而非’,’因此需要特别处理。
OpenCV 的实现:
在我调用read_csv函数时,发现OpenCV已经有实现类似功能的函数:intCvMLData::read_csv(constchar*filename)。利用CMake编译OpenCV,点击鼠标右键->转到定义可以方便查看opencv的源代码。(具体方法见以下链接博文)http://blog.csdn.net/solomon1558/article/details/43780533
实现一:
例程FisherfacesinOpenCV中的read_csv函数
staticvoidread_csv(conststring&filename,vector&images,vector&labels,charseparator=';'){
std::ifstreamfile(filename.c_str(),ifstream::in);
if(!file){
stringerror_message="Novalidinputfilewasgiven,pleasecheckthegivenfilename.";
CV_Error(CV_StsBadArg,error_message);
stringline,path,classlabel;
while(getline(file,line)){
stringstreamliness(line);
getline(liness,path,separator);
getline(liness,classlabel);
if(!path.empty()&&!classlabel.empty()){
images.push_back(imread(path,0));
labels.push_back(atoi(classlabel.c_str()));
实现二:intCvMLData::read_csv(constchar*filename)
intCvMLData::read_csv(constchar*filename)
constintM=1000000;
constcharstr_delimiter[3]={'',delimiter,'\0'};
FILE*file=0;
CvMemStorage*storage;
CvSeq*seq;
char*ptr;
float*el_ptr;
CvSeqReaderreader;
intcols_count=0;
uchar*var_types_ptr=0;
clear();
file=fopen(filename,"rt");
return-1;
//readthefirstlineanddeterminethenumberofvariables
std::vector_buf(M);
char*buf=&_buf[0];
if(!fgets_chomp(buf,M,file))
fclose(file);
ptr=buf;
while(*ptr=='')
ptr++;
for(;*ptr!='\0';)
if(*ptr==delimiter||*ptr=='')
cols_count++;
while(*ptr=='')ptr++;
else
if(cols_count==0)
//createtemporarymemorystoragetostorethewholedatabase
el_ptr=newfloat[cols_count];
storage=cvCreateMemStorage();
seq=cvCreateSeq(0,sizeof(*seq),cols_count*sizeof(float),storage);
var_types=cvCreateMat(1,cols_count,CV_8U);
cvZero(var_types);
var_types_ptr=var_types->data.ptr;
for(;;)
char*token=NULL;
inttype;
token=strtok(buf,str_delimiter);
if(!token)
break;
for(inti=0;i{str_to_flt_elem(token,el_ptr[i],type);var_types_ptr[i]|=type;token=strtok(NULL,str_delimiter);if(!token){fclose(file);delete[]el_ptr;return-1;}}str_to_flt_elem(token,el_ptr[cols_count-1],type);var_types_ptr[cols_count-1]|=type;cvSeqPush(seq,el_ptr);if(!fgets_chomp(buf,M,file))break;}fclose(file);values=cvCreateMat(seq->total,cols_count,CV_32FC1);missing=cvCreateMat(seq->total,cols_count,CV_8U);var_idx_mask=cvCreateMat(1,values->cols,CV_8UC1);cvSet(var_idx_mask,cvRealScalar(1));train_sample_count=seq->total;cvStartReadSeq(seq,&reader);for(inti=0;itotal;i++){constfloat*sdata=(float*)reader.ptr;float*ddata=values->data.fl+cols_count*i;uchar*dm=missing->data.ptr+cols_count*i;for(intj=0;j{ddata[j]=sdata[j];dm[j]=(fabs(MISS_VAL-sdata[j])<=FLT_EPSILON);}CV_NEXT_SEQ_ELEM(seq->elem_size,reader);}if(cvNorm(missing,0,CV_L1)<=FLT_EPSILON)cvReleaseMat(&missing);cvReleaseMemStorage(&storage);delete[]el_ptr;return0;}
str_to_flt_elem(token,el_ptr[i],type);
var_types_ptr[i]|=type;
token=strtok(NULL,str_delimiter);
delete[]el_ptr;
str_to_flt_elem(token,el_ptr[cols_count-1],type);
var_types_ptr[cols_count-1]|=type;
cvSeqPush(seq,el_ptr);
values=cvCreateMat(seq->total,cols_count,CV_32FC1);
missing=cvCreateMat(seq->total,cols_count,CV_8U);
var_idx_mask=cvCreateMat(1,values->cols,CV_8UC1);
cvSet(var_idx_mask,cvRealScalar(1));
train_sample_count=seq->total;
cvStartReadSeq(seq,&reader);
for(inti=0;itotal;i++)
constfloat*sdata=(float*)reader.ptr;
float*ddata=values->data.fl+cols_count*i;
uchar*dm=missing->data.ptr+cols_count*i;
for(intj=0;j{ddata[j]=sdata[j];dm[j]=(fabs(MISS_VAL-sdata[j])<=FLT_EPSILON);}CV_NEXT_SEQ_ELEM(seq->elem_size,reader);}if(cvNorm(missing,0,CV_L1)<=FLT_EPSILON)cvReleaseMat(&missing);cvReleaseMemStorage(&storage);delete[]el_ptr;return0;}
ddata[j]=sdata[j];
dm[j]=(fabs(MISS_VAL-sdata[j])<=FLT_EPSILON);
CV_NEXT_SEQ_ELEM(seq->elem_size,reader);
if(cvNorm(missing,0,CV_L1)<=FLT_EPSILON)
cvReleaseMat(&missing);
cvReleaseMemStorage(&storage);
return0;
最多设置5个标签!
1.CSV文件格式简介
逗号分隔值(Comma-SeparatedValues,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
CSV文件格式的通用标准并不存在,但是在RFC4180中有基础性的描述。使用的字符编码同样没有被指定,但是7-bitASCII是最基本的通用编码。
一般情况下,CSV文件格式规则如下:
1. 开头是不留空,以行为单位。
2. 可含或不含列名,含列名则居文件第一行。
3. 一行数据不跨行,无空行。
4. 以半角逗号(即,)作分隔符,列为空也要表达其存在。
5. 列内容如存在半角逗号(即,)则用半角双引号(即"")将该字段值包含起来。
6. 列内容如存在半角引号(即")则应替换成半角双引号("")转义,并用半角引号(即"")将该字段值包含起来。
7. 文件读写时引号,逗号操作规则互逆。
8. 内码格式不限,可为ASCII、Unicode或者其他。
9. 不支持特殊字符
2.Mat矩阵数据存储到CSV文件中
博文“C++读写CSV文件”提出了一种CSV文件的读取遍历算法和写入算法,http://www.cnblogs.com/snake-hand/p/3170483.html,并利用C++实现了对CSV文件的读、写操作。
本文结合OpenCV的CSV风格格式化输出与流缓冲重定向,比较巧妙地实现了“将Mat矩阵数据存储到CSV文件”功能。
代码如下:
//保存cout流缓冲区指针
streambuf*coutBuf=cout.rdbuf();
fstreammatData("E:\\Test\\data\\fire_2.csv",ios::out|ios::trunc);
if(!matData){
cerr<<"Fileopenorcreateerror!"<
exit(1);
}
//获取文件fire.csv的流缓冲区指针
streambuf*fileBuf=matData.rdbuf();
//设置cout流缓冲区指针为文件的流缓冲区指针
cout.rdbuf(fileBuf);
cout<
matData.flush();
matData.close();
//恢复cout原来的流缓冲区指针
cout.rdbuf(coutBuf);
测试结果:
3.从CSV文件读取数据到Mat矩阵
以下代码为我自己写的read_csv函数,实现了从CSV文件读取数据到Mat矩阵中的功能。
/**
*函数功能:将csv文件数据提取到Mat类型矩阵中
*输入:filepath文件路径数组指针;img_sizeMat类型数据的Size;img_typeMat类型数据的类型(32FC1)
*返回值:Mat矩阵
*/
Matread_csv(constchar*filepath,Sizeimg_size,intimg_type)
{
Matimage;
image.create(img_size,img_type);
stringpixel;
ifstreamfile(filepath,ifstream::in);
if(!file)
cout<<"CSVreadfail"<
intnl=image.rows;//numberoflines
intnc=image.cols;//numberofcolumns
inteolElem=image.cols-1; //每行最后一个元素的下标
intelemCount=0;
if(image.isContinuous())
{
nc=nc*nl;//thennopaddedpixels
nl=1; //itisnowa1Darray
}
for(inti=0;i
{
float*data=(float*)image.ptr(i);
for(intj=0;j
{
if(elemCount==eolElem){
getline(file,pixel,''); //任意地读入,直到读到delim字符'',delim字符不会被放入buffer中
data[j]=(float)atof(pixel.c_str()); //将字符串str转换成一个双精度数值并返回结果
elemCount=0; //计数器置零
}
else{
getline(file,pixel,','); //任意地读入,直到读到delim字符','delim字符不会被放入buffer中
data[j]=(float)atof(pixel.c_str()); //将字符串str转换成一个双精度数值并返回结果
elemCount++;
}
}
}
returnimage;
}
测试结果:
注意事项:
注意每一个记录结束时以’’结尾,而非’,’因此需要特别处理。
OpenCV 的实现:
在我调用read_csv函数时,发现OpenCV已经有实现类似功能的函数:intCvMLData::read_csv(constchar*filename)。利用CMake编译OpenCV,点击鼠标右键->转到定义可以方便查看opencv的源代码。(具体方法见以下链接博文)http://blog.csdn.net/solomon1558/article/details/43780533
实现一:
例程FisherfacesinOpenCV中的read_csv函数
staticvoidread_csv(conststring&filename,vector&images,vector&labels,charseparator=';'){
std::ifstreamfile(filename.c_str(),ifstream::in);
if(!file){
stringerror_message="Novalidinputfilewasgiven,pleasecheckthegivenfilename.";
CV_Error(CV_StsBadArg,error_message);
}
stringline,path,classlabel;
while(getline(file,line)){
stringstreamliness(line);
getline(liness,path,separator);
getline(liness,classlabel);
if(!path.empty()&&!classlabel.empty()){
images.push_back(imread(path,0));
labels.push_back(atoi(classlabel.c_str()));
}
}
}
实现二:intCvMLData::read_csv(constchar*filename)
intCvMLData::read_csv(constchar*filename)
{
constintM=1000000;
constcharstr_delimiter[3]={'',delimiter,'\0'};
FILE*file=0;
CvMemStorage*storage;
CvSeq*seq;
char*ptr;
float*el_ptr;
CvSeqReaderreader;
intcols_count=0;
uchar*var_types_ptr=0;
clear();
file=fopen(filename,"rt");
if(!file)
return-1;
//readthefirstlineanddeterminethenumberofvariables
std::vector_buf(M);
char*buf=&_buf[0];
if(!fgets_chomp(buf,M,file))
{
fclose(file);
return-1;
}
ptr=buf;
while(*ptr=='')
ptr++;
for(;*ptr!='\0';)
{
if(*ptr==delimiter||*ptr=='')
{
cols_count++;
ptr++;
while(*ptr=='')ptr++;
}
else
ptr++;
}
cols_count++;
if(cols_count==0)
{
fclose(file);
return-1;
}
//createtemporarymemorystoragetostorethewholedatabase
el_ptr=newfloat[cols_count];
storage=cvCreateMemStorage();
seq=cvCreateSeq(0,sizeof(*seq),cols_count*sizeof(float),storage);
var_types=cvCreateMat(1,cols_count,CV_8U);
cvZero(var_types);
var_types_ptr=var_types->data.ptr;
for(;;)
{
char*token=NULL;
inttype;
token=strtok(buf,str_delimiter);
if(!token)
break;
for(inti=0;i
{
str_to_flt_elem(token,el_ptr[i],type);
var_types_ptr[i]|=type;
token=strtok(NULL,str_delimiter);
if(!token)
{
fclose(file);
delete[]el_ptr;
return-1;
}
}
str_to_flt_elem(token,el_ptr[cols_count-1],type);
var_types_ptr[cols_count-1]|=type;
cvSeqPush(seq,el_ptr);
if(!fgets_chomp(buf,M,file))
break;
}
fclose(file);
values=cvCreateMat(seq->total,cols_count,CV_32FC1);
missing=cvCreateMat(seq->total,cols_count,CV_8U);
var_idx_mask=cvCreateMat(1,values->cols,CV_8UC1);
cvSet(var_idx_mask,cvRealScalar(1));
train_sample_count=seq->total;
cvStartReadSeq(seq,&reader);
for(inti=0;itotal;i++)
{
constfloat*sdata=(float*)reader.ptr;
float*ddata=values->data.fl+cols_count*i;
uchar*dm=missing->data.ptr+cols_count*i;
for(intj=0;j
{
ddata[j]=sdata[j];
dm[j]=(fabs(MISS_VAL-sdata[j])<=FLT_EPSILON);
}
CV_NEXT_SEQ_ELEM(seq->elem_size,reader);
}
if(cvNorm(missing,0,CV_L1)<=FLT_EPSILON)
cvReleaseMat(&missing);
cvReleaseMemStorage(&storage);
delete[]el_ptr;
return0;
}
一周热门 更多>