当前位置: 首页 > news >正文

上海远程教育网站设计与开发公司游戏推广公司怎么接游戏的

上海远程教育网站设计与开发公司,游戏推广公司怎么接游戏的,怎么做网站兼容性测试,合肥web网站建设1. 概念: RDD: 弹性分布式数据集; DataFrame: DataFrame是一种以RDD为基础的分布式数据集,类似于传统数据库中的二维表格。带有schema元信息,即DataFrame所表示的二维表数据集的每一列都带有名称和类型…

1. 概念:

RDD:

弹性分布式数据集;

DataFrame:

DataFrame是一种以RDD为基础的分布式数据集,类似于传统数据库中的二维表格。带有schema元信息,即DataFrame所表示的二维表数据集的每一列都带有名称和类型。这样的数据集可以用SQL查询。DataFrame是不可变的,即一旦创建,就不能修改其内容。

DataFrame 是 DataSet[Row]

DataSet:

简单的说,DataSet和DataFrame的区别就是,DataSet会在编译阶段就进行类型检查 ,而DataFrame在运行阶段才会类型检查。

Dataset是一个强类型的特定领域的对象,Dataset也被称为DataFrame的类型化视图,这种DataFrame是Row类型的Dataset,即Dataset[Row]。Dataset结合了DataFrame的优化和RDD的类型安全。Dataset提供了编译时类型检查(而DataFrame不会,DataFrame只会在运行阶段才会检查类型),确保数据在编译阶段就符合预期的类型。

dataset是dataFrame的升级版对象,dataframe是一个传统的sql编程对象,如果要想使用dataframe进行灵活开发的比较复杂。

dataset和dataFrame是一个类别的对象,都是可以进行sql查询数据的,并且可以支持rdd上面的方法。

当我们需要对一个表对象进行二次处理的话建议大家转换为dataset而不是dataframe。

package com.hainiu.sparkimport org.apache.spark.sql.{Dataset, SparkSession}object TestDSAndDF {def main(args: Array[String]): Unit = {val session = SparkSession.builder().master("local[*]").appName("test").getOrCreate()import session.implicits._val ds: Dataset[String] = session.read.textFile("file:///headless/workspace/spark/data/a.txt")ds.map(t=>{val strs = t.split(" ")(strs(0), strs(1), strs(2), strs(3))})//    val df = session.read.format("org.apache.spark.sql.execution.datasources.v2.text.TextDataSourceV2")
//      .load("file:///headless/workspace/spark/data/a.txt")
//    
//    val ds: Dataset[(String, String, String, String)] = df.map(row => {
//      val line = row.getAs[String]("value")
//      val strs = line.split(" ")
//      (strs(0), strs(1), strs(2), strs(3))
//    })}
}

2. 三者之间的转换

  val ds: Dataset[String] = session.read.textFile("file:///headless/workspace/spark/data/a.txt")ds.map(t=>{val strs = t.split(" ")(strs(0), strs(1), strs(2), strs(3))})val df1 = ds.toDF("id","name","age","gender")val df: Dataset[Row] = session.read.format("org.apache.spark.sql.execution.datasources.v2.text.TextDataSourceV2").load("file:///headless/workspace/spark/data/a.txt")val rdd = session.sparkContext.textFile("file:///headless/workspace/spark/data/a.txt")rdd.toDS()rdd.toDF()df.rddds.rdd

http://www.ritt.cn/news/24145.html

相关文章:

  • 北京高端网站建设飞沐营销推广
  • 廊坊专业网站建设南宁seo推广优化
  • 做房产的一般用哪个网站seo关键词查询
  • 江苏省住房和城乡建设厅网站首页seo在哪可以学
  • 网站建设论坛7b固件升级seo软件
  • Wordpress在中国建站山东大学经济研究院
  • 通用网站后台管理系统(php版)河北高端网站建设
  • 建个什么网站好呢产品运营方案
  • 凡科送审平台官网seo分析工具有哪些
  • 成都平台网站开发公司在线代理浏览国外网站
  • 做网站 怎么备案软件怎么推广
  • 网站建设用什么系统好广州建网站的公司
  • 铜陵网站制作discuz论坛seo设置
  • 商城属于电商网站吗沈阳网站seo
  • 网站营销推广专业的营销团队哪里找
  • java网站开发环境配置百度app下载官方免费下载最新版
  • 有一个做ppt的网站网络服务提供者收集和使用个人信息应当符合的条件有
  • 做夜夜做网站酒店营销推广方案
  • 网站开发设计招聘注册网站需要多少钱?
  • 中铁建设门户网登录入口在哪seo高手是怎样炼成的
  • 安全的营销型网站建设百度商业平台
  • 建站推广外包数据分析师资格证书怎么考
  • 怎样在一个虚拟服务器里做两个网站爱站长
  • 做网站开发需要培训吗网络营销ppt
  • 买域名有什么用seo搜索优化专员
  • 政务网站集约化建设要求怎么做一个免费的网站
  • 宝鸡网站建设一般多少钱seo文章是什么意思
  • wordpress日志在哪个文件夹网站推广优化怎样
  • 我的世界搞头怎么做的视频网站通过百度指数不能判断出
  • 深圳网站建设黄浦网络网站的推广方案的内容有哪些