主要内容

数据存储

대규모의데이터모음을저장할데이터저장소만들기

설명

예제

ds=数据存储(位置位置으로지정된데이터의모음으로부터데이터저장소를만듭니다。데이터저장소는너무커서메모리에담을수없는데이터를모아놓은저장공간입니다。ds를만든후에는데이터를읽고처리할수있습니다。

예제

ds=数据存储(位置名称,值는하나이상의이름-값쌍의通讯录수를사용하여ds에대한추가파라미터를지정합니다。예를들면,“类型”,“图像”를지정하여이미지파일을저장할데이터저장소를만들수있습니다。

예제

모두 축소

샘플 파일airlinesmall.csv에대한데이터저장소를만듭니다。이파일에는1987년부터2008년까지의항공사데이터가들어있습니다。

숫자형열에서누락된데이터를가져오는작업을관리하려면“TreatAsMissing”“MissingValue”이름-값通讯录수를사용하십시오。“TreatAsMissing”의 값을“NA”로지정하고“MissingValue”의값을0으로지정하여가져온데이터에서모든경우의“NA”를0으로바꿉니다。

数据存储(“airlinesmall.csv”“TreatAsMissing”“NA”...“MissingValue”, 0)
ds = TabularTextDatastore属性:文件:{' B:\matlab\toolbox\matlab\demos\airlinesmal .csv'}文件夹:{' B:\matlab\toolbox\matlab\demos'} FileEncoding: 'UTF-8' AlternateFileSystemRoots: {} variablenamgrule: 'modify' ReadVariableNames: true VariableNames:{'年','月','月日'…和26个更多}DatetimeLocale: en_US文本格式属性:NumHeaderLines: 0分隔符:',' RowDelimiter: '\r\n' TreatAsMissing: 'NA' MissingValue: 0高级文本格式属性:TextscanFormats: {'%f', '%f', '%f'…TextType: 'char' ExponentCharacters: 'eEdD' CommentStyle: "空格:' \b\t' MultipleDelimitersAsOne: false属性,控制表返回预览,读取,readall: SelectedVariableNames:{'年','月','月日'…和26}SelectedFormats: {% f ', ' % f ', ' % f '……ReadSize: 20000行OutputType: 'table' RowTimes:[]写属性:supportedoutputformat: ["txt" "csv" "xlsx" "xls" "parquet" "parq"] DefaultOutputFormat: "txt"

数据存储TabularTextDatastore를만듭니다。

Matlab®경로와그하위폴더에있는모든.tif파일을포함하는데이터저장소를만듭니다。

Ds =数据存储(fullfile(matlabroot,“工具箱”“matlab”),...“IncludeSubfolders”,真的,“FileExtensions”“.tif”“类型”“图像”
ds =ImageDatastore的属性:文件:{'H:\matlab\toolbox\matlab\demos\example.tif';'H:\matlab\toolbox\matlab\imagesci\玉米.tif'}文件夹:{'H:\matlab\toolbox\matlab'} AlternateFileSystemRoots: {} ReadSize: 1标签:{}SupportedOutputFormats: ["png" "jpg" "jpeg" "tif" "tiff"] DefaultOutputFormat: "png" ReadFcn: @readDatastoreImage

입력marketing수

모두 축소

데이터저장소에포함할파일또는폴더로,文件集객체,파일경로또는DsFileSet객체로지정됩니다。

  • 文件集객체-位置文件集객체로지정할수있습니다。위치를文件集객체로지정하면경로나DsFileSet객체로지정하는경우보다데이터저장소생성시간이빨라집니다。자세한내용은matlab.io.datastore.FileSet항목을참조하십시오。

  • 파일경로——문자형벡터나字符串형스칼라로하나의파일경로를지정할수있습니다。여러개의파일경로는문자형벡터로구성된셀형배열또는字符串형배열로지정하면됩니다。

  • DsFileSet객체-DsFileSet객체를지정할수있습니다。자세한내용은matlab.io.datastore.DsFileSet을참조하십시오。

파일이나폴더는로컬또는원격이될수있습니다。

  • 로컬파일또는폴더-파일또는폴더의로컬경로를지정합니다。파일이현재폴더에없는경우전체경로나상대경로를지정합니다。지정된폴더의하위폴더내에있는파일은데이터저장소에자동으로포함되지않습니다。로컬경로를지정할때에는와일드카드문자(*)를사용할수있습니다。이문자는모든일치하는파일또는일치하는폴더의모든파일을데이터저장소에포함하도록지정합니다。

  • 원격파일또는폴더-hdfs: / / /path_to_file형식의URL(统一资源定位器)을사용하여원격파일또는폴더의전체경로로지정합니다。자세한내용은원격데이터로작업하기항목을참조하십시오。

폴더를지정하면데이터저장소는지원되는파일형식의파일만포함하며그외다른형식의파일은무시합니다。데이터저장소에포함할파일확장자목록을사용자지정하려면FileExtensions속성을참조하십시오。

KeyValueDatastore의경우,이파일은mapreduce함수에의해생성된mat파일또는시퀀스파일이어야합니다。Mat파일은로컬파일시스템이나네트워크파일시스템에있어야합니다。시퀀스파일은로컬파일시스템,네트워크파일시스템,HDFS™파일시스템중하나에있을수있습니다。DatabaseDatastore의위치수는파일일필가없습니다。자세한내용은DatabaseDatastore(数据库工具箱)를참조하십시오。

예:“file1.csv”

예:“. . / dir /数据/ file1.jpg”

예:{“C: \ dir \ data \ file1.xls”,“C: \ dir \ data \ file2.xlsx”}

예:“C: \ dir \ data \ * .mat’

예:“hdfs: / / /数据/中”

이름-값通讯录수

선택적수쌍을Name1 = Value1,…,以=家으로지정합니다。여기서的名字은수이름이고价值는대응값입니다。이름-값수는다른수뒤에와야하지만,수쌍의순서는상관없습니다。

R2021a이전릴리스에서는쉼` ` `를사용하여각이름과값을구분하고的名字을따옴@ @로묶으십시오。

예:FileExtensions,{“jpg”、“.tif”}ImageDatastore객체에대한jpg또는.tif확장자를갖는모든확장자를포함합니다。

데이터저장소유형으로,“类型”과함께다음중하나가쉼@ @로구분되어지정됩니다。

“类型”의값 설명
“tabulartext” 테이블형식데이터를포함하는텍스트파일입니다。데이터의tmp코딩은ASCII또는utf-8이어야합니다。
“图像” Jpeg나png와같은형식의이미지파일입니다。허용되는파일에는imformats형식이포함됩니다。
“表格” 하나이상의시트를포함하는스프레드시트파일입니다。
“keyvalue” mapreduce에서생성된데이터와함께mat파일이나시퀀스파일에포함된키-값쌍데이터입니다。
“文件” 사용자지정형식파일로,데이터를읽기위해서는읽기함수가지정되어야합니다。자세한내용은FileDatastore를참조하십시오。
“高” 데이터형의함수에의해생성된mat파일또는시퀀스파일입니다。자세한내용은TallDatastore를참조하십시오。
“铺” 열방향데이터를포함하는拼花파일。자세한내용은ParquetDatastore를참조하십시오。
“数据库” 데이터베이스에저장된데이터입니다。数据库工具箱™가필합니다。类型파라미터를사용할경우추가입력수의사양이필합니다。자세한내용은DatabaseDatastore(数据库工具箱)를참조하십시오。
  • 파일여러개의형식을지원하기위하여데이터저장소유형을여러개지정해야할경우에는“类型”수를사용하여데이터저장소유형을지정해야합니다。

  • “类型”의값을지정하지않으면数据存储가파일의확장자를기반으로,생성할데이터저장소의적합한유형을자동으로지정합니다。

데이터형:字符|字符串

폴더내에있는하위폴더포함여부로,“IncludeSubfolders”와 함께真正的(1)나(0)가쉼로구분되어지정됩니다。각폴더내에있는모든파일과하위폴더를포함하려면真正的를지정하고,각폴더내에있는파일만포함하려면를지정하십시오。

“IncludeSubfolders”를지정하지않으면디폴트값로지정됩니다。

“IncludeSubfolders”이름-값쌍은다음객체를생성하는경우에만유효합니다。

  • TabularTextDatastore

  • ImageDatastore

  • SpreadsheetDatastore

  • FileDatastore

  • KeyValueDatastore

  • ParquetDatastore

예:“IncludeSubfolders”,真的

데이터형:逻辑|

파일의확장자로,“FileExtensions”와함께문자형벡터,문자형벡터로구성된셀형배열,字符串형스칼라또는字符串형배열이쉼표로구분되어지정됩니다。“FileExtensions”를지정할때에는“类型”도지정해야합니다。빈따옴를사용하면확장자없이파일을나타낼수있습니다。

“FileExtensions”가지정되지않으면数据存储가데이터저장소유형에따라모든지원되는파일확장자를자동으로포함시킵니다。지원되지않는확장자를포함시키려면포함시킬확장자를개별적으로지정해야합니다。

  • TabularTextDatastore객체에대해지원되는확장자에는. txt. csv.dat.dlm.asc。text가포함되며,확장자가없는경우도지원됩니다。

  • ImageDatastore객체에대해지원되는확장자에는모든imformats확장자가포함됩니다。

  • SpreadsheetDatastore객체에대해지원되는확장자에는xls.xlsx.xlsm.xltx.xltm이포함됩니다。

  • TallDatastore객체에대해지원되는확장자에는.mat.seq가포함됩니다。

  • ParquetDatastore객체에대해지원되는확장자에는.parquet.parq가포함됩니다。

“FileExtensions”이름-값쌍은다음객체를생성하는경우에만유효합니다。

  • TabularTextDatastore

  • ImageDatastore

  • SpreadsheetDatastore

  • FileDatastore

  • KeyValueDatastore

  • ParquetDatastore

예:“FileExtensions”、“jpg”

예:FileExtensions, {' . txt ', '。text '}

데이터형:字符|细胞|字符串

파일시스템루트경로의대체경로로,“AlternateFileSystemRoots”와함께字符串형벡터또는셀형배열로구성된이름-값v3수로지정됩니다。로컬컴퓨터에데이터저장소를만들지만다른컴퓨터(다른운영체제의컴퓨터일수있음)의데이터에액세스하고이를처리해야하는경우“AlternateFileSystemRoots”를사용합니다。또한并行计算工具箱™와MATLAB®并行服务器™를사용하여데이터를처리하고,처리한데이터를다른플랫폼클라우드또는다른클러스터컴퓨터에있는데이터의복사본과함께로컬컴퓨터에저장할경우“AlternateFileSystemRoots”를사용하여루트경로를연결해야합니다。

  • 실질적으로서로동일한루트경로들의집합을연결하려면“AlternateFileSystemRoots”를字符串형벡터로지정하십시오。예를들면다음과같습니다。

    [" Z: \数据集”、“/ mynetwork /数据集”)

  • 데이터저장소에대한실질적으로동일한여러루트경로의집합을여러개연결하려면“AlternateFileSystemRoots”를여러행이포함된셀형배열로지정하십시오。여기서각행은실질적으로동일한루트경로들의집합하나를나타냅니다。셀형배열의각행을字符串형벡터또는문자형벡터로구성된셀형배열로지정합니다。예를들면다음과같습니다。

    • “AlternateFileSystemRoots”를字符串형벡터로구성된셀형배열로지정합니다。

      {[Z: \“数据集”、“/ mynetwork /数据集”);…[" Y: \数据集”、“/ mynetwork2 /数据集”、“年代:\数据集”)}

    • 또는“AlternateFileSystemRoots”를문자형벡터로구성된셀형배열로지정합니다。

      {{“Z: \数据集”、“mynetwork /数据集”},…{“Y: \数据集”,“mynetwork2 /数据集”,年代:\数据集的}}

“AlternateFileSystemRoots”의값은다음조건을충족해야합니다。

  • 하나이상의행을포함합니다。여기서각행은실질적으로동일한여러루트경로를지정합니다。

  • 각행은여러개의루트경로를지정하고,각루트경로는적어도두개의문자를포함해야합니다。

  • 루트경로는고유하며서로의하위폴더가아닙니다。

  • 파일의위치를가리키는적어도하나의루트경로항목을포함합니다。

자세한내용은为不同机器或集群上的处理设置数据存储항목을참조하십시오。

예:[" Z: \数据集”、“/ mynetwork /数据集”)

데이터형:字符串|细胞

텍스트변수의출력데이터형으로,“TextType”과 함께“字符”이나“字符串”이쉼@ @로구분되어지정됩니다。readall预览함수중하나의출력테이블에텍스트변수가포함된경우“TextType”TabularTextDatastore객체와SpreadsheetDatastore객체에대해서만이러한변수의데이터형을지정합니다。“TextType”“字符”경우출력값은문자형벡터로구성된셀형배열입니다。“TextType”“字符串”경우출력값은字符串형입니다。

데이터형:字符|字符串

가져오는날짜/시간데이터의유형으로,“DatetimeType”과 함께“datetime”이나“文本”값중하나가쉼@ @로구분되어지정됩니다。“DatetimeType”化学式수는TabularTextDatastore객체를만들때에만적용됩니다。

가져오는날짜/시간데이터의유형
“datetime”

MATLABdatetime데이터형

자세한내용은datetime을참조하십시오。

“文本”

“DatetimeType”“文本”로지정된경우,가져오는날짜/시간데이터의유형은“TextType”파라미터에지정된값에따라달라집니다。

  • “TextType”“字符”化学式경우数据存储는날짜를문자형벡터로구성된셀형배열로반환합니다。

  • “TextType”“字符串”化学式경우数据存储는날짜를字符串형배열로반환합니다。

예:“DatetimeType”、“日期时间的

데이터형:字符|字符串

텍스트파일의duration형데이터의출력데이터형으로,“DurationType”과 함께“持续时间”이나“文本”가쉼@ @로구분되어지정됩니다。

가져오는duration형데이터의유형
“持续时间”

MATLAB持续时间데이터형

자세한내용은持续时间을참조하십시오。

“文本”

“DurationType”“文本”로지정된경우,가져오는时长형데이터의유형은“TextType”파라미터에지정된값에따라달라집니다。

  • “TextType”“字符”인경우가져오기함수는时间형데이터를문자형벡터로구성된셀형배열로반환합니다。

  • “TextType”“字符串”rm경우가져오기함수는duration형데이터를string형배열로반환합니다。

데이터형:字符|字符串|datetime

변수이름을유지할지지정하는플래그로,“修改”또는“保存”중하나로지정됩니다。

  • “修改”-유효하지않은변수이름(유효여부는isvarname함수의판정에따름)을유효한matlab식별자로변환합니다。

  • “保存”——공백과비ASCII문자가포함된변수이름과같이MATLAB식별자로유효하지않은변수이름을그대로유지합니다。

R2019b부터변수이름과행이름에공백,비ASCII문자등모든문자를사용할수있습니다。또한문자뿐만아니라어떤문자로도시작할수있습니다。변수이름과행이름은유효한matlab식별자(유효여부는isvarname함수의판정에따름)가아니어도됩니다。변수이름과행이름을그대로유지하려면VariableNamingRule의 값을“保存”로설정하십시오。VariableNamingRule의 값이“修改”에서“保存”로변경될때변수이름은새로고쳐지지않습니다。

데이터형:字符|字符串

이이름-값쌍외에도,다음객체의모든속성(단,文件속성은제외)을이름-값쌍으로지정할수있습니다。

출력marketing수

모두 축소

데이터모음에대한데이터저장소로,TabularTextDatastoreImageDatastoreSpreadsheetDatastoreKeyValueDatastoreFileDatastoreTallDatastoreParquetDatastoreDatabaseDatastore객체중하나로반환됩니다。데이터저장소의유형은파일형식이나位置수에따라달라집니다。자세한내용을보려면다음@ @에서데이터저장소이름을클릭하십시오。

유형 출력값
텍스트파일 TabularTextDatastore
이미지파일 ImageDatastore
스프레드시트파일 SpreadsheetDatastore
mapreduce에의해생성된mat파일또는시퀀스파일 KeyValueDatastore
사용자지정형식파일 FileDatastore
데이터형의함수에의해생성된mat파일또는시퀀스파일입니다。 TallDatastore
拼花파일 ParquetDatastore
데이터베이스 DatabaseDatastore(数据库工具箱)

이러한데이터저장소유형각각에대한文件속성은문자형벡터로구성된셀형배열입니다。각각의문자형벡터는位置수로확된파일의절대경로입니다。

버전 내역

R2014b에개발됨

Baidu
map