当前位置: 首页 > news >正文

中级网站开发工程师 试题怎么免费注册域名

中级网站开发工程师 试题,怎么免费注册域名,wordpress 百度云图安装,网站建设可实施性报告Flink Streaming Connector Flink是新一代流批统一的计算引擎,它需要从不同的第三方存储引擎中把数据读过来,进行处理,然后再写出到另外的存储引擎中。Connector的作用就相当于一个连接器,连接Flink计算引擎跟外界存储系统。Flin…

Flink Streaming Connector

Flink是新一代流批统一的计算引擎,它需要从不同的第三方存储引擎中把数据读过来,进行处理,然后再写出到另外的存储引擎中。Connector的作用就相当于一个连接器,连接Flink计算引擎跟外界存储系统。Flink里有以下几种方式,当然也不限于这几种方式可以跟外界进行数据交换:
【1】Flink里面预定义了一些sourcesink
【2】Flink内部也提供了一些Boundled connectors
【3】可以使用第三方Apache Bahir项目中提供的连接器;
【4】是通过异步IO方式;

预定义的 source 和 sink

Flink里预定义了一部分sourcesink。在这里分了几类。
[点击并拖拽以移动] ​

基于文件的 source 和 sink

如果要从文本文件中读取数据,可以直接使用:

env.readTextFile(path)

就可以以文本的形式读取该文件中的内容。当然也可以使用:根据指定的fileInputFormat格式读取文件中的内容。

env.readFile(fileInputFormat, path)

如果数据在Flink内进行了一系列的计算,想把结果写出到文件里,也可以直接使用内部预定义的一些sink,比如将结果已文本或csv格式写出到文件中,可以使用DataStreamwriteAsText(path)DataSetwriteAsCsv(path)

基于 Socket 的 Source 和 Sink

提供 Sockethost nameport,可以直接用StreamExecutionEnvironment预定的接口socketTextStream创建基于Socketsource,从该 socket中以文本的形式读取数据。当然如果想把结果写出到另外一个Socket,也可以直接调用DataStream writeToSocket

//从 socket 中读取数据流
env.socketTextStream("localhost",777);
//输出至 socket 
resultDataStream.writeToSocket("hadoop1",6666,new SimpleStringSchema())

基于内存 Collections、Iterators 的 Source

可以直接基于内存中的集合或者迭代器,调用StreamExecutionEnvironment fromCollectionfromElements构建相应的source。结果数据也可以直接printprintToError的方式写出到标准输出或标准错误。详细也可以参考Flink源码中提供的一些相对应的Examples来查看异常预定义 sourcesink的使用方法,例如WordCountSocketWindowWordCount

//从Java.util.Collection集合中读取数据作为数据源
ArrayList<String> list = new ArrayList<>(5);
list.add("flink");
list.add("scala");
list.add("spark");
list.add("hadoop");
list.add("hive");
env.fromCollection(list).print();//从Java.util.Collection集合中读取数据作为数据源env.fromElements("flink", "scala", "spark", "hadoop", "hive").print();

Bundled Connectors

Flink里已经提供了一些绑定的Connector,例如kafka sourcesinkEs sink等。读写kafkaesrabbitMQ时可以直接使用相应 connectorapi即可。

虽然该部分是Flink项目源代码里的一部分,但是真正意义上不算作Flink引擎相关逻辑,并且该部分没有打包在二进制的发布包里面。所以在提交Job时候需要注意,job代码jar包中一定要将相应的connetor相关类打包进去,否则在提交作业时就会失败,提示找不到相应的类,或初始化某些类异常。
[点击并拖拽以移动] ​

Apache Bahir 中的连接器

Apache Bahir最初是从Apache Spark中独立出来项目提供,以提供不限于Spark相关的扩展 / 插件、连接器和其他可插入组件的实现。通过提供多样化的流连接器streaming connectorsSQL数据源扩展分析平台的覆盖面。如有需要写到flumeredis的需求的话,可以使用该项目提供的connector
[点击并拖拽以移动] ​

Async I/O

流计算中经常需要与外部存储系统交互,比如需要关联MySQL中的某个表。一般来说,如果用同步I/O的方式,会造成系统中出现大的等待时间,影响吞吐和延迟。为了解决这个问题,异步I/O可以并发处理多个请求,提高吞吐,减少延迟。Async的原理可参考官方文档
[点击并拖拽以移动] ​

http://www.ritt.cn/news/29092.html

相关文章:

  • 河源市新闻最新消息seo优化代理
  • wordpress dux5.3鼓楼网页seo搜索引擎优化
  • 网站建设带主机安徽seo优化
  • 全国公安机关网站备案关键词推广技巧
  • 做软件的中介网站百度知道提问
  • 做系统网站建设无锡百姓网推广
  • 郑州新闻头条最新消息搜索引擎优化的五个方面
  • 用固定ip做访问网站服务器外贸google推广
  • 信息产业部网站备案系统百度搜索热词排行榜
  • 网站网页设计设计方案网络营销的含义特点
  • 主流建站开源程序有哪些苏州网站关键词优化推广
  • 深圳城乡和住房建设局网站首页如何做好线上推广和引流
  • 做网站自适应框架百度seo关键词排名优化工具
  • 潍坊哪里有做360网站的seo是哪个英文的简写
  • 中国建设银行门户网站南宁整合推广公司
  • 网络工程师免费教程宁波seo外包
  • 企业信息系统的架构seo如何提高排名
  • 做网站跟做app哪个累石家庄seo关键词
  • 企业网站开发公司排名引擎搜索优化
  • 如何写代码做网站6seo公司后付费
  • wordpress小工具 样式广州百度搜索排名优化
  • 邵阳网站建设上海seo博客
  • 长春做网站外包久久seo正规吗
  • 专注网站开发三亚百度推广地址
  • 网站开发的工作内容seo还有未来吗
  • 做网站用到的java技术搜索引擎优化的定义
  • wordpress主题后台管理seo优化内容
  • 学做游戏 网站网站设计说明
  • 珠海专业医疗网站建设球队排名榜实时排名
  • 企业网站用vps还是虚拟主机网络促销的方法有哪些