当前位置: 首页 > news >正文

百度网站收录提交入口在哪seo研究中心学员案例

百度网站收录提交入口在哪,seo研究中心学员案例,做网站除了域名还用什么,哪里有网站建设官网需求描述 通过读取目录下的类似文件的datapath路径的文件名及文件内容,需要将读取的每一个文件的文件名日期解析出来,并作为读取当前文件内容递归读取当前文件一个df列,列名为“时间”;后面就是读一个文件,解析一下时间…

需求描述

        通过读取目录下的类似文件的datapath路径的文件名及文件内容,需要将读取的每一个文件的文件名日期解析出来,并作为读取当前文件内容递归读取当前文件一个df列,列名为“时间”;后面就是读一个文件,解析一下时间,将时间添加到所读文件的dataframe中,相当于给每一个读的文件内容添加了当前读取文件解析出来的时间列,以此递归循环。读取每一个文件后都要加上一列此文件解析出来的时间,形式如下

  Reading file: hdfs://master.test.com:8020/data/测试文件/_L_20231025095119.txtReading file: hdfs://master.test.com:8020/data/测试文件/_L_20231026095119.txtReading file: hdfs://master.test.com:8020/data/测试文件/_L_20231027095119.txt


内容形式如下

  文件名:L_20231025095119.txt文件内容:id,imsi,lon,lat......文件名:L_20231026095119.txt文件内容:id,imsi,lon,lat......文件名:L_20231027095119.txt文件内容:id,imsi,lon,lat......我要的文件内容输出形式为id,imsi,lon,lat,20231025095119...id,imsi,lon,lat,20231026095119...id,imsi,lon,lat,20231027095119......

代码片段:

...
...
//打印读取目录下的文件名
println("文件datapath路径")
if (dataPath.isEmpty) {println("No files to read.")
} else {for (path <- dataPath) {println(s"Reading file: $path")}
}
// 解析时间字段
// 提取文件名中的时间部分,格式为:"_L_20231111095119.txt" 中的 "20231111095119"
// 由于文件名是按目录读取的,因此要变成字符串形式并以逗号隔开
val filePath = dataPath.mkString(",")
val fileName = filePath.split("/").last.stripSuffix(".csv")
val timeStr = fileName.split("_").last
val year = timeStr.substring(0, 4)
val month = timeStr.substring(4, 6)
val day = timeStr.substring(6, 8)
val hour = timeStr.substring(8, 10)
val minute = timeStr.substring(10, 12)
val second = timeStr.substring(12, 14)
val time = s"$year-$month-$day $hour:$minute:$second"
println(time)
// 输出时间类似:2023-03-01 09:51:19
...
...
val rddAll = if(dataPath.isEmpty){sc.emptyRDD[(LongWritable,Text)]
} else {sc.newAPIHadoopRDD(jobConf,classOf[CombineTextInputFormat],classOf[LongWritable],classOf[Text])}val firstLine = {if(rddAll.take(1).length == 0){null} else {val firstLineTemp = rddAll.first()._2getAfterSplitArray(delimiter,new String(firstLineTemp.getBytes,0,firstLineTemp.getLength,encoding))}
}
...
...
val outDF = sqlc.createDataFrame(outRDD,schema)
//2修改
val outDF1 = outDF.withColumn("时间", lit(time))
outDF1.show()

http://www.ritt.cn/news/24043.html

相关文章:

  • 网站是否能够被恶意镜像win10优化大师怎么样
  • 邯郸网站建设找谁燃灯seo
  • 教育行业网站建设网络营销策略的概念
  • 凡科做商品网站的教学视频除了91还有什么关键词
  • 比较多人用什么网站做推广一键优化软件
  • 宁波建网站价格什么是seo如何进行seo
  • 电子商务网站开发方式seo服务的内容
  • 推广做网站怎么样百度seo关键词排名
  • 有什么网站可以做宣传百度搜索优化
  • 马尼拉做网站高清的网站制作
  • 公司的网站建设一般需要多少费用十大免费网站推广入口
  • 微博网站模板 css谷歌seo运营
  • 中小学学校网站建设柳州网站建设
  • 代申请可信网站免费的网络营销方式
  • 做蛋糕网站的 实训报告图焦作整站优化
  • 网站专题报道页面怎么做的seo百度关键词优化软件
  • wordpress做网站网站建设详细方案模板
  • 定制网站开发报价单网站服务器多少钱一年
  • 门户网站开发建设技术b2b外链
  • 做网站还是做阿里策划营销推广方案
  • 专门做游戏交易的网站站长之家seo查询官方网站
  • 透视政务网站百度公司总部
  • 网站开发报价单最近军事新闻热点大事件
  • 我想给赌博网站做代理经典软文案例200字
  • 登陆美国网站做报价单 网速慢谷歌搜索引擎入口363
  • 网站备案为什么要关闭seo优化诊断
  • 红酒哪个网站做的好nba交易最新消息
  • 通化网站开发郑州纯手工seo
  • vuejs做视频网站网站站点查询
  • 什么网站可以做锦鲤活动电商平台怎么注册