`
sillycat
  • 浏览: 2486527 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

Apache Parquet(1)Introduction

 
阅读更多
Apache Parquet(1)Introduction

https://github.com/Parquet/parquet-mr
Support all the languages


References:
https://parquet.apache.org/documentation/latest/
https://github.com/Parquet/parquet-mr
分享到:
评论

相关推荐

    json2parquet:将JSON文件转换为Apache Parquet

    JSON转换为Parquet 将JSON文件转换为Apache Parquet。 您可能也对 , 或。安装下载预编译的二进制文件您可以从获取最新版本。带货物cargo install json2parquet用法USAGE: json2parquet [FLAGS] [OPTIONS] <JSON> ...

    flink-parquet_2.11-1.10.0-API文档-中文版.zip

    标签:flink、11、apache、parquet_2、jar包、java、API文档、中文版; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译,文档中的代码和结构保持不变,注释和说明...

    ParquetViewer:用于查看和查询Apache Parquet文件的简单Windows桌面应用程序

    实木复合地板查看器一个简单的Windows桌面应用程序,用于查看和查询Apache Parquet文件。 另请查阅Wiki以获取详细的用户指南: : 概括这是我创建的一种快速而肮脏的实用程序,可以轻松地在Windows台式机上查看Apache...

    Parquet格式:Apache Parquet

    实木复合地板元数据使用Apache Thrift进行编码。 Parquet-format项目包含所有Thrift定义,这些定义对于创建Parquet文件的读取器和写入器是必需的。 动机 我们创建Parquet是为了使Hadoop生态系统中的任何项目都可以...

    parquet-dotnet::dolphin:适用于现代.Net的Apache Parquet

    适用于.Net平台的Apache Parquet 状态 Parquet.Net大部分是由我自己开发的,尽管我试图为此项目投入一些时间,但并非总是可以从我的日常工作或晚上节省时间。 如果您想赞助此项目,请单击上方的Sponsor按钮,然后...

    parquet-common-1.10.0-API文档-中文版.zip

    Maven坐标:org.apache.parquet:parquet-common:1.10.0; 标签:apache、common、parquet、jar包、java、API文档、中文版; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 ...

    parquet-mr:Apache Parquet

    实木复合地板 Parquet-MR包含的java实现。 Parquet是Hadoop一种列式存储格式; 它提供了有效的数据存储和编码... wget -nv http://archive.apache.org/dist/thrift/0.13.0/thrift-0.13.0.tar.gz tar xzf thrift-0.13.

    parquet-hadoop-1.10.1-API文档-中文版.zip

    对应Maven信息:groupId:org.apache.parquet,artifactId:parquet-hadoop,version:1.10.1 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译,文档中的代码和...

    Petastorm库支持以Apache Parquet格式对来自数据集的深度学习模型进行单机或分布式培训和评估。 它支持Tensorflow,Pytorch和PySpark等ML框架,并且可以从纯Python代码中使用。-Python开发

    Petastorm内容Petastorm安装生成数据集普通Python API Tensorflow API Pytorch API Spark数据集转换器API分析...该库可直接从Apache Parquet格式的数据集中进行单机或分布式培训以及对深度学习模型的评估。 佩塔斯

    parquet-dotnet::volleyball:适用于现代.NET的Apache Parquet

    适用于.Net平台的Apache Parquet 请注意, 为提供商业支持,因此,如果您需要任何专业建议或快速开发新功能和错误修正,请写信至 。 状态 核心构建 Windows / Linux / Mac测试 完全托管的.NET库,用于读写文件。 ...

    parquet-column-1.10.1-API文档-中文版.zip

    Maven坐标:org.apache.parquet:parquet-column:1.10.1; 标签:apache、parquet、column、中文文档、jar包、java; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化...

    parquet-avro-1.10.0-API文档-中文版.zip

    Maven坐标:org.apache.parquet:parquet-avro:1.10.0; 标签:apache、parquet、avro、jar包、java、API文档、中文版; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化...

    parquet-format-2.3.1-API文档-中英对照版.zip

    Maven坐标:org.apache.parquet:parquet-format:2.3.1; 标签:apache、format、parquet、jar包、java、API文档、中英对照版; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。...

    parquet-common-1.8.2-API文档-中文版.zip

    Maven坐标:org.apache.parquet:parquet-common:1.8.2; 标签:apache、common、parquet、jar包、java、中文文档; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译...

    parquet-encoding-1.8.2-API文档-中文版.zip

    Maven坐标:org.apache.parquet:parquet-encoding:1.8.2; 标签:apache、encoding、parquet、jar包、java、中文文档; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化...

    FlinkParquet:使用Parquet文件格式(使用Avro)通过Apache Flink处理数据

    使用Apache Flink处理Apache Parquet文件此仓库包含用于设置Flink数据流以处理Parquet文件的示例代码。 resources/下的CSV数据集是从下载的Restaurant Score数据集。 有关更多信息,请参见。 ###生成Avro模型类如果...

    geo-arrow-spec:在Apache Arrow和Apache Parquet中存储地理空间数据的规范

    在Apache Arrow和Apache Parquet中存储地理空间数据的规范。 项目指定了与语言无关的标准化列式存储格式。 它支持共享计算库,零拷贝共享内存和流式消息传递,进程间通信等,并且受到许多编程语言的支持。 Feather...

    parquet-hadoop-1.8.2-API文档-中文版.zip

    Maven坐标:org.apache.parquet:parquet-hadoop:1.8.2; 标签:apache、hadoop、parquet、jar包、java、中文文档; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译...

    无需python查看parquet文件

    https://github.com/apache/parquet-mr 编译: cd parquet-tools && mvn clean package -Plocal 使用方式: (1)查看schema java -jar parquet-tools-1.8.2.jar cat parquet文件 (2)查看内容给: java -jar ...

    C++ 读写 parquet 文件 Demo

    项目使用vs2015,使用的git上的三方开源框架,进行了裁剪,基于C++创建,读写parquet文件。

Global site tag (gtag.js) - Google Analytics