当前位置: 首页 > news >正文

专题网站开发 交互方法原画培训班一般学费多少

专题网站开发 交互方法,原画培训班一般学费多少,b2c网站的销售设计流程,做一个flash网站多少钱大数据系列之:读取parquet文件统计数据量 一、Spark读取parquet文件统计数据量二、parquet-tools统计parquet文件数据量三、实际应用案例 一、Spark读取parquet文件统计数据量 首先,创建一个 SparkSession 对象: val spark SparkSession.b…

大数据系列之:读取parquet文件统计数据量

  • 一、Spark读取parquet文件统计数据量
  • 二、parquet-tools统计parquet文件数据量
  • 三、实际应用案例

一、Spark读取parquet文件统计数据量

  1. 首先,创建一个 SparkSession 对象:
val spark = SparkSession.builder().appName("Parquet Data Count").getOrCreate()
  1. 然后,使用 SparkSession 读取 Parquet 文件并将其转换为 DataFrame:
val data = spark.read.format("parquet").load("/path/to/hdfs/parquet/file")
  1. 最后,使用 DataFrame 的 count 方法进行数据量统计:
val count = data.count()

二、parquet-tools统计parquet文件数据量

下载parquet-tools工具

使用 Hadoop 命令行工具:

  1. 首先,使用 Hadoop 命令行工具 hadoop 运行以下命令:
hadoop fs -cat /path/to/hdfs/parquet/file | parquet-tools rowcount
  1. 该命令将读取 Parquet 文件并使用 parquet-tools 工具来统计数据量,并输出结果。

三、实际应用案例

读取hdfs上的parquet文件:

%sparkval data = spark.read.format("parquet").load("/optics/ods_optics_prod/packing_data_item_1h_a/datetime=2023122514/part-00000-2675f81c-3c90-4af7-a489-bd8ce5cfec2c-c000.zstd.parquet")

查看数据量:

%spark
val count = data.count()count: Long = 433173
http://www.ritt.cn/news/16241.html

相关文章:

  • 天津多媒体设计公司百度seo优
  • 2018什么语言做网站比较好搜索引擎网站入口
  • 微网站 微官网的区别seo是什么软件
  • 广东网站建设报价今天热点新闻
  • 网站建设费用IP百度网站推广费用多少
  • 网站被很多公司抄袭整合网络营销是什么
  • 免费接码网页版中国seo关键词优化软件手机
  • 商城类网站备案免费开网店免费供货
  • 站长工具官方网企业官网建站
  • 新乡做网站公司电话排名优化网站seo排名
  • 网站内部优化有哪些内容福州关键词排名优化
  • 网站站内搜索怎么做保定关键词优化软件
  • 怎样用网站做淘宝客汕头seo代理
  • 做网站卖广告位赚钱郑州网络营销策划
  • 那个网站做推广比较好大连seo按天付费
  • 电商类网站怎么做推广郑州网络营销推广
  • 北京网站建设公司分享网站改版注意事项广州营销课程培训班
  • 联通物联网服务运营平台seo外包优化服务商
  • 珠海网站定制开发seo上排名
  • 重庆企业做网站看b站视频软件下载安装
  • 网站忘记后台地址百度投放广告流程
  • 网站空间的存放种类想要网站推广版
  • 枣庄高端网站建设营销网络推广
  • 自驾游自由行网站建设最新消息
  • 万网发布网站外贸网站推广公司
  • wordpress去掉版权信息深圳seo优化服务
  • 网站服务公司代买空间有无义务seopc流量排行榜企业
  • 网站建设教程哪家公司好seo平台有哪些
  • xampp wordpress服务器深圳seo优化推广
  • 简约大气商务网站bt蚂蚁磁力搜索天堂