数据存储
대규모의데이터모음을저장할데이터저장소만들기
설명
예제
텍스트데이터의데이터저장소생성
샘플 파일airlinesmall.csv
에대한데이터저장소를만듭니다。이파일에는1987년부터2008년까지의항공사데이터가들어있습니다。
숫자형열에서누락된데이터를가져오는작업을관리하려면“TreatAsMissing”
및“MissingValue”
이름-값通讯录수를사용하십시오。“TreatAsMissing”
의 값을“NA”
로지정하고“MissingValue”
의값을0으로지정하여가져온데이터에서모든경우의“NA”
를0으로바꿉니다。
数据存储(“airlinesmall.csv”,“TreatAsMissing”,“NA”,...“MissingValue”, 0)
ds = TabularTextDatastore属性:文件:{' B:\matlab\toolbox\matlab\demos\airlinesmal .csv'}文件夹:{' B:\matlab\toolbox\matlab\demos'} FileEncoding: 'UTF-8' AlternateFileSystemRoots: {} variablenamgrule: 'modify' ReadVariableNames: true VariableNames:{'年','月','月日'…和26个更多}DatetimeLocale: en_US文本格式属性:NumHeaderLines: 0分隔符:',' RowDelimiter: '\r\n' TreatAsMissing: 'NA' MissingValue: 0高级文本格式属性:TextscanFormats: {'%f', '%f', '%f'…TextType: 'char' ExponentCharacters: 'eEdD' CommentStyle: "空格:' \b\t' MultipleDelimitersAsOne: false属性,控制表返回预览,读取,readall: SelectedVariableNames:{'年','月','月日'…和26}SelectedFormats: {% f ', ' % f ', ' % f '……ReadSize: 20000行OutputType: 'table' RowTimes:[]写属性:supportedoutputformat: ["txt" "csv" "xlsx" "xls" "parquet" "parq"] DefaultOutputFormat: "txt"
数据存储
가TabularTextDatastore
를만듭니다。
이미지데이터의데이터저장소만들기
Matlab®경로와그하위폴더에있는모든.tif
파일을포함하는데이터저장소를만듭니다。
Ds =数据存储(fullfile(matlabroot,“工具箱”,“matlab”),...“IncludeSubfolders”,真的,“FileExtensions”,“.tif”,“类型”,“图像”)
ds =ImageDatastore的属性:文件:{'H:\matlab\toolbox\matlab\demos\example.tif';'H:\matlab\toolbox\matlab\imagesci\玉米.tif'}文件夹:{'H:\matlab\toolbox\matlab'} AlternateFileSystemRoots: {} ReadSize: 1标签:{}SupportedOutputFormats: ["png" "jpg" "jpeg" "tif" "tiff"] DefaultOutputFormat: "png" ReadFcn: @readDatastoreImage
입력marketing수
位置
- - - - - -데이터저장소에포함할파일또는폴더
경로|DsFileSet
객체
데이터저장소에포함할파일또는폴더로,文件集
객체,파일경로또는DsFileSet
객체로지정됩니다。
文件集
객체-位置
을文件集
객체로지정할수있습니다。위치를文件集
객체로지정하면경로나DsFileSet
객체로지정하는경우보다데이터저장소생성시간이빨라집니다。자세한내용은matlab.io.datastore.FileSet
항목을참조하십시오。파일경로——문자형벡터나字符串형스칼라로하나의파일경로를지정할수있습니다。여러개의파일경로는문자형벡터로구성된셀형배열또는字符串형배열로지정하면됩니다。
DsFileSet
객체-DsFileSet
객체를지정할수있습니다。자세한내용은matlab.io.datastore.DsFileSet
을참조하십시오。
파일이나폴더는로컬또는원격이될수있습니다。
로컬파일또는폴더-파일또는폴더의로컬경로를지정합니다。파일이현재폴더에없는경우전체경로나상대경로를지정합니다。지정된폴더의하위폴더내에있는파일은데이터저장소에자동으로포함되지않습니다。로컬경로를지정할때에는와일드카드문자(*)를사용할수있습니다。이문자는모든일치하는파일또는일치하는폴더의모든파일을데이터저장소에포함하도록지정합니다。
원격파일또는폴더-
hdfs: / / /
형식의URL(统一资源定位器)을사용하여원격파일또는폴더의전체경로로지정합니다。자세한내용은원격데이터로작업하기항목을참조하십시오。path_to_file
폴더를지정하면데이터저장소는지원되는파일형식의파일만포함하며그외다른형식의파일은무시합니다。데이터저장소에포함할파일확장자목록을사용자지정하려면FileExtensions
속성을참조하십시오。
KeyValueDatastore
의경우,이파일은mapreduce
함수에의해생성된mat파일또는시퀀스파일이어야합니다。Mat파일은로컬파일시스템이나네트워크파일시스템에있어야합니다。시퀀스파일은로컬파일시스템,네트워크파일시스템,HDFS™파일시스템중하나에있을수있습니다。DatabaseDatastore
의위치수는파일일필가없습니다。자세한내용은DatabaseDatastore
(数据库工具箱)를참조하십시오。
예:“file1.csv”
예:“. . / dir /数据/ file1.jpg”
예:{“C: \ dir \ data \ file1.xls”,“C: \ dir \ data \ file2.xlsx”}
예:“C: \ dir \ data \ * .mat’
예:“hdfs: / / /数据/中”
이름-값通讯录수
선택적수쌍을Name1 = Value1,…,以=家
으로지정합니다。여기서的名字
은수이름이고价值
는대응값입니다。이름-값수는다른수뒤에와야하지만,수쌍의순서는상관없습니다。
R2021a이전릴리스에서는쉼` ` `를사용하여각이름과값을구분하고的名字
을따옴@ @로묶으십시오。
예:FileExtensions,{“jpg”、“.tif”}
는ImageDatastore
객체에대한jpg
또는.tif
확장자를갖는모든확장자를포함합니다。
类型
- - - - - -데이터저장소유형
“tabulartext”
|“图像”
|“表格”
|“keyvalue”
|“文件”
|“高”
|……
데이터저장소유형으로,“类型”
과함께다음중하나가쉼@ @로구분되어지정됩니다。
“类型” 의값 |
설명 |
---|---|
“tabulartext” |
테이블형식데이터를포함하는텍스트파일입니다。데이터의tmp코딩은ASCII또는utf-8이어야합니다。 |
“图像” |
Jpeg나png와같은형식의이미지파일입니다。허용되는파일에는imformats 형식이포함됩니다。 |
“表格” |
하나이상의시트를포함하는스프레드시트파일입니다。 |
“keyvalue” |
mapreduce 에서생성된데이터와함께mat파일이나시퀀스파일에포함된키-값쌍데이터입니다。 |
“文件” |
사용자지정형식파일로,데이터를읽기위해서는읽기함수가지정되어야합니다。자세한내용은FileDatastore 를참조하십시오。 |
“高” |
高 데이터형의写 함수에의해생성된mat파일또는시퀀스파일입니다。자세한내용은TallDatastore 를참조하십시오。 |
“铺” |
열방향데이터를포함하는拼花파일。자세한내용은ParquetDatastore 를참조하십시오。 |
“数据库” |
데이터베이스에저장된데이터입니다。数据库工具箱™가필합니다。类型 파라미터를사용할경우추가입력수의사양이필합니다。자세한내용은DatabaseDatastore (数据库工具箱)를참조하십시오。 |
파일여러개의형식을지원하기위하여데이터저장소유형을여러개지정해야할경우에는
“类型”
수를사용하여데이터저장소유형을지정해야합니다。“类型”
의값을지정하지않으면数据存储
가파일의확장자를기반으로,생성할데이터저장소의적합한유형을자동으로지정합니다。
데이터형:字符
|字符串
IncludeSubfolders
- - - - - -폴더내에있는하위폴더포함여부
真正的
또는假
|0또는1
폴더내에있는하위폴더포함여부로,“IncludeSubfolders”
와 함께真正的
(1)나假
(0)가쉼로구분되어지정됩니다。각폴더내에있는모든파일과하위폴더를포함하려면真正的
를지정하고,각폴더내에있는파일만포함하려면假
를지정하십시오。
“IncludeSubfolders”
를지정하지않으면디폴트값假
로지정됩니다。
“IncludeSubfolders”
이름-값쌍은다음객체를생성하는경우에만유효합니다。
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
ParquetDatastore
예:“IncludeSubfolders”,真的
데이터형:逻辑
|双
FileExtensions
- - - - - -파일의확장자
문자형벡터|문자형벡터로구성된셀형배열|字符串형스칼라|字符串형배열
파일의확장자로,“FileExtensions”
와함께문자형벡터,문자형벡터로구성된셀형배열,字符串형스칼라또는字符串형배열이쉼표로구분되어지정됩니다。“FileExtensions”
를지정할때에는“类型”
도지정해야합니다。빈따옴”
를사용하면확장자없이파일을나타낼수있습니다。
“FileExtensions”
가지정되지않으면数据存储
가데이터저장소유형에따라모든지원되는파일확장자를자동으로포함시킵니다。지원되지않는확장자를포함시키려면포함시킬확장자를개별적으로지정해야합니다。
TabularTextDatastore
객체에대해지원되는확장자에는. txt
,. csv
,.dat
,.dlm
,.asc
,。text
가포함되며,확장자가없는경우도지원됩니다。ImageDatastore
객체에대해지원되는확장자에는모든imformats
확장자가포함됩니다。SpreadsheetDatastore
객체에대해지원되는확장자에는xls
,.xlsx
,.xlsm
,.xltx
,.xltm
이포함됩니다。TallDatastore
객체에대해지원되는확장자에는.mat
및.seq
가포함됩니다。ParquetDatastore
객체에대해지원되는확장자에는.parquet
및.parq
가포함됩니다。
“FileExtensions”
이름-값쌍은다음객체를생성하는경우에만유효합니다。
TabularTextDatastore
ImageDatastore
SpreadsheetDatastore
FileDatastore
KeyValueDatastore
ParquetDatastore
예:“FileExtensions”、“jpg”
예:FileExtensions, {' . txt ', '。text '}
데이터형:字符
|细胞
|字符串
AlternateFileSystemRoots
- - - - - -파일시스템루트경로의대체경로
字符串형벡터|셀형 배열
파일시스템루트경로의대체경로로,“AlternateFileSystemRoots”
와함께字符串형벡터또는셀형배열로구성된이름-값v3수로지정됩니다。로컬컴퓨터에데이터저장소를만들지만다른컴퓨터(다른운영체제의컴퓨터일수있음)의데이터에액세스하고이를처리해야하는경우“AlternateFileSystemRoots”
를사용합니다。또한并行计算工具箱™와MATLAB®并行服务器™를사용하여데이터를처리하고,처리한데이터를다른플랫폼클라우드또는다른클러스터컴퓨터에있는데이터의복사본과함께로컬컴퓨터에저장할경우“AlternateFileSystemRoots”
를사용하여루트경로를연결해야합니다。
실질적으로서로동일한루트경로들의집합을연결하려면
“AlternateFileSystemRoots”
를字符串형벡터로지정하십시오。예를들면다음과같습니다。[" Z: \数据集”、“/ mynetwork /数据集”)
데이터저장소에대한실질적으로동일한여러루트경로의집합을여러개연결하려면
“AlternateFileSystemRoots”
를여러행이포함된셀형배열로지정하십시오。여기서각행은실질적으로동일한루트경로들의집합하나를나타냅니다。셀형배열의각행을字符串형벡터또는문자형벡터로구성된셀형배열로지정합니다。예를들면다음과같습니다。“AlternateFileSystemRoots”
를字符串형벡터로구성된셀형배열로지정합니다。{[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}
또는
“AlternateFileSystemRoots”
를문자형벡터로구성된셀형배열로지정합니다。{{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}
“AlternateFileSystemRoots”
의값은다음조건을충족해야합니다。
하나이상의행을포함합니다。여기서각행은실질적으로동일한여러루트경로를지정합니다。
각행은여러개의루트경로를지정하고,각루트경로는적어도두개의문자를포함해야합니다。
루트경로는고유하며서로의하위폴더가아닙니다。
파일의위치를가리키는적어도하나의루트경로항목을포함합니다。
자세한내용은为不同机器或集群上的处理设置数据存储항목을참조하십시오。
예:[" Z: \数据集”、“/ mynetwork /数据集”)
데이터형:字符串
|细胞
TextType
- - - - - -텍스트변수의출력데이터형
“字符”
(디폴트값)|“字符串”
텍스트변수의출력데이터형으로,“TextType”
과 함께“字符”
이나“字符串”
이쉼@ @로구분되어지정됩니다。读
,readall
,预览
함수중하나의출력테이블에텍스트변수가포함된경우“TextType”
은TabularTextDatastore
객체와SpreadsheetDatastore
객체에대해서만이러한변수의데이터형을지정합니다。“TextType”
이“字符”
경우출력값은문자형벡터로구성된셀형배열입니다。“TextType”
이“字符串”
경우출력값은字符串
형입니다。
데이터형:字符
|字符串
DatetimeType
- - - - - -가져오는날짜/시간데이터의유형
“datetime”
(디폴트값)|“文本”
가져오는날짜/시간데이터의유형으로,“DatetimeType”
과 함께“datetime”
이나“文本”
값중하나가쉼@ @로구분되어지정됩니다。“DatetimeType”
化学式수는TabularTextDatastore
객체를만들때에만적용됩니다。
값 | 가져오는날짜/시간데이터의유형 |
---|---|
“datetime” |
MATLAB 자세한내용은 |
“文本” |
|
예:“DatetimeType”、“日期时间的
데이터형:字符
|字符串
DurationType
- - - - - -持续时间형데이터의출력데이터형
“持续时间”
(디폴트값)|“文本”
텍스트파일의duration형데이터의출력데이터형으로,“DurationType”
과 함께“持续时间”
이나“文本”
가쉼@ @로구분되어지정됩니다。
값 | 가져오는duration형데이터의유형 |
---|---|
“持续时间” |
MATLAB 자세한내용은 |
“文本” |
|
데이터형:字符
|字符串
|datetime
VariableNamingRule
- - - - - -변수이름을유지할지지정하는플래그
“修改”
(디폴트값)|“保存”
변수이름을유지할지지정하는플래그로,“修改”
또는“保存”
중하나로지정됩니다。
“修改”
-유효하지않은변수이름(유효여부는isvarname
함수의판정에따름)을유효한matlab식별자로변환합니다。“保存”
——공백과비ASCII문자가포함된변수이름과같이MATLAB식별자로유효하지않은변수이름을그대로유지합니다。
R2019b부터변수이름과행이름에공백,비ASCII문자등모든문자를사용할수있습니다。또한문자뿐만아니라어떤문자로도시작할수있습니다。변수이름과행이름은유효한matlab식별자(유효여부는isvarname
함수의판정에따름)가아니어도됩니다。변수이름과행이름을그대로유지하려면VariableNamingRule
의 값을“保存”
로설정하십시오。VariableNamingRule
의 값이“修改”
에서“保存”
로변경될때변수이름은새로고쳐지지않습니다。
데이터형:字符
|字符串
이이름-값쌍외에도,다음객체의모든속성(단,文件
속성은제외)을이름-값쌍으로지정할수있습니다。
출력marketing수
ds
-데이터모음에대한데이터저장소
TabularTextDatastore
|ImageDatastore
|SpreadsheetDatastore
|KeyValueDatastore
|FileDatastore
|TallDatastore
|……
데이터모음에대한데이터저장소로,TabularTextDatastore
,ImageDatastore
,SpreadsheetDatastore
,KeyValueDatastore
,FileDatastore
,TallDatastore
,ParquetDatastore
,DatabaseDatastore
객체중하나로반환됩니다。데이터저장소의유형은파일형식이나位置
수에따라달라집니다。자세한내용을보려면다음@ @에서데이터저장소이름을클릭하십시오。
유형 | 출력값 |
---|---|
텍스트파일 | TabularTextDatastore |
이미지파일 | ImageDatastore |
스프레드시트파일 | SpreadsheetDatastore |
mapreduce 에의해생성된mat파일또는시퀀스파일 |
KeyValueDatastore |
사용자지정형식파일 | FileDatastore |
高 데이터형의写 함수에의해생성된mat파일또는시퀀스파일입니다。 |
TallDatastore |
拼花파일 | ParquetDatastore |
데이터베이스 | DatabaseDatastore (数据库工具箱) |
이러한데이터저장소유형각각에대한文件
속성은문자형벡터로구성된셀형배열입니다。각각의문자형벡터는位置
수로확된파일의절대경로입니다。
버전 내역
R2014b에개발됨
Matlab명령
다음matlab명령에해당하는링크를클릭했습니다。
명령을실행하려면matlab명령창에입력하십시오。웹브라우저는matlab명령을지원하지않습니다。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。