主要内容

Tall Arrays和mapreduce

利用MATLAB并行分析大数据集®高数组和数据存储或mapreduce在火花®和Hadoop®集群和并行池

可以使用并行计算工具箱™使用桌面上的并行池并行计算高数组表达式。使用高数组可以运行不适合机器内存的大数据应用程序。还可以使用并行计算工具箱,通过连接到运行在上的并行池来扩展高数组处理MATLAB并行服务器集群。或者,您也可以使用启用Spark的Hadoop集群运行MATLAB并行服务器.有关更多信息,请参见使用高阵列和数据存储的大数据工作流

功能

全部展开

创建高数组
数据存储 为大型数据集合创建数据存储
mapreduce 用于分析不适合内存的数据集的编程技术
mapreduce 定义mapreduce和tall数组的并行执行环境
分区 对数据存储进行分区
numpartitions 数据存储分区数
parpool 在集群上创建并行池
gcp 获取当前并行池

全部展开

平行的。池 平行的工人池
parallel.cluster.Hadoop Hadoop集群用于mapreducer、mapreduce和tall数组
parallel.cluster.Spark 火花mapreducer、mapreduce和tall数组的集群

例子和如何

概念

Baidu
map