Apache NiFi Connector

此连接器提供可以读取和写入Apache NiFi的源(Source)和槽(Sink). 要使用此连接器,请将以下依赖项添加到您的项目中:

<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-connector-nifi_2.10</artifactId>
  <version>1.3-SNAPSHOT</version>
</dependency>

请注意,流连接器当前不是二进制分发的一部分。有关如何将程序与程序库打包以进行集群执行的信息,请参阅 此处

安装 Apache NiFi

有关设置Apache NiFi集群的说明可以在这里找到。

Apache NiFi 源

该连接器提供了从Apache NiFi到Apache Flink读取数据的源。

NiFiSource(…)类提供2个构建器(constructors),用于从NiFi读取数据。

  • NiFiSource(SiteToSiteConfig config) - 为指定客户端的SiteToSiteConfig构建一个NiFiSource(…),默认等待时间为1000 ms。

  • NiFiSource(SiteToSiteConfig config, long waitTimeMs) - 为指定客户端的SiteToSiteConfig和指定的等待时间(以毫秒为单位)构建一个NiFiSource(…)

示例:

StreamExecutionEnvironment streamExecEnv = StreamExecutionEnvironment.getExecutionEnvironment();

SiteToSiteClientConfig clientConfig = new SiteToSiteClient.Builder()
        .url("http://localhost:8080/nifi")
        .portName("Data for Flink")
        .requestBatchCount(5)
        .buildConfig();

SourceFunction<NiFiDataPacket> nifiSource = new NiFiSource(clientConfig);
val streamExecEnv = StreamExecutionEnvironment.getExecutionEnvironment()

val clientConfig: SiteToSiteClientConfig = new SiteToSiteClient.Builder()
       .url("http://localhost:8080/nifi")
       .portName("Data for Flink")
       .requestBatchCount(5)
       .buildConfig()

val nifiSource = new NiFiSource(clientConfig)

这里的数据从Apache NiFi输出端口读取,该端口称为“Data for Flink”,这是Apache NiFi站点到站点协议配置的一部分。

Apache NiFi 槽(Sink)

连接器提供了一个槽(Sink),用于将数据从Apache Flink写入Apache NiFi。

NiFiSink(…) 类提供了一个实例化NiFiSink的构造函数。

  • NiFiSink(SiteToSiteClientConfig, NiFiDataPacketBuilder<T>)为指定客户端的SiteToSiteConfigNiFiDataPacketBuilder构造了一个NiFiSink(…),它将数据从Flink转换为NiFiDataPacket,将由NiFi进行获取。

示例:

StreamExecutionEnvironment streamExecEnv = StreamExecutionEnvironment.getExecutionEnvironment();

SiteToSiteClientConfig clientConfig = new SiteToSiteClient.Builder()
        .url("http://localhost:8080/nifi")
        .portName("Data from Flink")
        .requestBatchCount(5)
        .buildConfig();

SinkFunction<NiFiDataPacket> nifiSink = new NiFiSink<>(clientConfig, new NiFiDataPacketBuilder<T>() {...});

streamExecEnv.addSink(nifiSink);
val streamExecEnv = StreamExecutionEnvironment.getExecutionEnvironment()

val clientConfig: SiteToSiteClientConfig = new SiteToSiteClient.Builder()
       .url("http://localhost:8080/nifi")
       .portName("Data from Flink")
       .requestBatchCount(5)
       .buildConfig()

val nifiSink: NiFiSink[NiFiDataPacket] = new NiFiSink[NiFiDataPacket](clientConfig, new NiFiDataPacketBuilder<T>() {...})

streamExecEnv.addSink(nifiSink)

有关 Apache NiFi站点到站点协议的更多信息,请点击 此处