58、Flink 的项目配置使用 Maven 详解

news/2024/7/8 3:25:05 标签: flink, maven, 大数据
2)使用 Maven
1.版本要求
  • Maven 3.8.6 (推荐或者使用更高版本)
  • Java 8 (deprecated) or Java 11
2.将项目导入 IDE

创建项目目录和文件后,建议将此项目导入到 IDE 进行开发和测试。

IntelliJ IDEA 支持开箱即用的 Maven 项目。

注意: Java 的默认 JVM 堆大小对于 Flink 来说可能太小,应该手动增加它;在 IntelliJ IDEA 中,推荐选中 Help | Edit Custom VM Options 菜单修改 JVM 属性。

关于 IntelliJ 的注意事项: 要使应用程序在 IntelliJ IDEA 中运行,需要在运行配置中的 Include dependencies with “Provided” scope 打勾;如果此选项不可用(可能是由于使用了较旧的 IntelliJ IDEA 版本),可创建一个调用应用程序 main() 方法的测试用例。

3.构建项目

如果想 构建/打包 项目,请转到项目目录并运行 ‘mvn clean package’ 命令,将 找到一个 JAR 文件,其中包含应用程序(还有已作为依赖项添加到应用程序的连接器和库):target/-.jar

注意: 如果使用不同于 DataStreamJob 的类作为应用程序的主类/入口点,建议对 pom.xml 文件里的 mainClassName 配置进行相应的修改,使 Flink 可以通过 JAR 文件运行应用程序,而无需额外指定主类。

4.向项目添加依赖项

打开项目目录的 pom.xml,在 dependencies 标签内添加依赖项。

例如,可以用如下方式添加 Kafka 连接器依赖:

<dependencies>
    
    <dependency>
        <groupId>org.apache.flink</groupId>
        <artifactId>flink-connector-kafka</artifactId>
        <version>1.19.0</version>
    </dependency>
    
</dependencies>

然后在命令行执行 mvn install

当在由 Java Project TemplateScala Project Template 或 Gradle 创建出来的项目里,运行 mvn clean package 会自动将应用程序依赖打包进应用程序 JAR。

对于不是通过这些模板创建的项目,建议使用 Maven Shade 插件以将所有必需的依赖项打包进应用程序 jar。

重要提示: 应将所有这些(核心)依赖项的生效范围置为 provided。即需要对它们进行编译,但不应将它们打包进项目生成的应用程序 JAR 文件中;如果不设置为 provided,最好的情况是生成的 JAR 变得过大,因为它还包含所有 Flink 核心依赖项;最坏的情况是添加到应用程序 JAR 文件中的 Flink 核心依赖项与集群一些依赖项的版本冲突(通常通过反向类加载来避免)。

要将依赖项正确地打包进应用程序 JAR 中,必须把应用程序依赖项的生效范围设置为 compile

5.打包应用程序

在部署应用到 Flink 环境之前,需要根据使用场景用不同的方式打包 Flink 应用程序。

如果想为 Flink 作业创建 JAR 并且只使用 Flink 依赖而不使用任何第三方依赖(比如使用 JSON 格式的文件系统连接器),则不需要创建一个 uber/fat JAR 或将任何依赖打进包。

如果想为 Flink 作业创建 JAR 并使用未内置在 Flink 发行版中的外部依赖项,可以将它们添加到发行版的类路径中,或者将它们打包进您的 uber/fat 应用程序 JAR 中。

可以将生成的 uber/fat JAR 提交到本地或远程集群:

bin/flink run -c org.example.MyJob myFatJar.jar
6.创建包含依赖项的 uber/fat JAR 的模板

为构建一个包含所有必需的连接器、 类库依赖项的应用程序 JAR,可以使用如下 shade 插件定义:

<build>
    <plugins>
        <plugin>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-shade-plugin</artifactId>
            <version>3.1.1</version>
            <executions>
                <execution>
                    <phase>package</phase>
                    <goals>
                        <goal>shade</goal>
                    </goals>
                    <configuration>
                        <artifactSet>
                            <excludes>
                                <exclude>com.google.code.findbugs:jsr305</exclude>
                            </excludes>
                        </artifactSet>
                        <filters>
                            <filter>
                                <!-- Do not copy the signatures in the META-INF folder.
                                Otherwise, this might cause SecurityExceptions when using the JAR. -->
                                <artifact>*:*</artifact>
                                <excludes>
                                    <exclude>META-INF/*.SF</exclude>
                                    <exclude>META-INF/*.DSA</exclude>
                                    <exclude>META-INF/*.RSA</exclude>
                                </excludes>
                            </filter>
                        </filters>
                        <transformers>
                            <transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer">
                                <!-- Replace this with the main class of your job -->
                                <mainClass>my.programs.main.clazz</mainClass>
                            </transformer>
                            <transformer implementation="org.apache.maven.plugins.shade.resource.ServicesResourceTransformer"/>
                        </transformers>
                    </configuration>
                </execution>
            </executions>
        </plugin>
    </plugins>
</build>

Maven shade 插件默认会包含所有的生效范围是 “runtime” 或 “compile” 的依赖项


http://www.niftyadmin.cn/n/5536117.html

相关文章

数据库之SQL(一)

目录 一、简述数据库分页 二、简述SQL中的聚合函数 三、简述表与表是如何关联的 四、简述外连接 五、简述数据库的左连接和右连接 一、简述数据库分页 1、MySQL分页语法&#xff1a; 在MySQL中&#xff0c;SELECT语句默认返回所有匹配的行&#xff0c;它们可能是指定表中的…

ARM架构服务器/虚拟机编译部署Tendis(国产化替换Redis)

文章目录 一、概述 二、安装相关组件 三、下载最新的Tendis源码 四、编译源码 五、启动Tendis 六、使用Docker镜像部署Tendis 七、常见报错 八、参考链接 一、概述 国产化项目要求尽可能使用国产组件,尤其是已存在的项目,需要替换已有组件,比如使用Tendis替换Redis。…

【LeetCode】十三、分治法:多数元素 + 最大子序列和

文章目录 1、分治法2、leetcode169&#xff1a;多数元素3、leetcode53&#xff1a;最大子序和 1、分治法 分治一般都搭配递归使用&#xff1a; 用分治法的一个应用——归并排序&#xff1a;将一组数不停的一分为二&#xff0c;直到分到每组只有一个数的时候 分到每组只有一个数…

LLama-Factory大模型训练框架,基于自己数据集微调qwen7B模型实战

一&#xff0c;项目简介 LLama-Factory&#xff0c;大模型训练框架&#xff0c;支持多种模型&#xff0c;多种训练方式&#xff0c; 项目github地址&#xff1a;link 项目特色 多种模型&#xff1a;LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGL…

《自动驾驶中的SLAM技术》第2章: 基础数学知识回顾 习题

自动驾驶中的SLAM技术 第2章: 基础数学知识回顾 习题 1 分别使用左右扰动模型&#xff0c;计算 ∂ R − 1 p ∂ R \frac{\partial \mathbf{R}^{-1}\mathbf{p}}{\partial \mathbf{R}} ∂R∂R−1p​。 左扰动模型 ∂ R − 1 p ∂ R lim ⁡ δ ϕ → 0 ( E x p ( δ ϕ ) R…

数据结构(3.8)——栈的应用

栈在括号匹配中的应用 流程图 代码 #include <stdio.h> #include <stdlib.h> #define MaxSize 10typedef struct {char data[MaxSize];int top; } SqStack;// 初始化栈 void InitStack(SqStack* S) {S->top -1; // 初始化栈顶指针 }// 判空 bool StackEmpty(…

JavaScript 原型链那些事

在讲原型之前我们先来了解一下函数。 在JS中&#xff0c;函数的本质就是对象&#xff0c;它与其他对象不同的是&#xff0c;创建它的构造函数与创建其他对象的构造函数不一样。那产生函数对象的构造函数是什么呢&#xff1f;是一个叫做Function的特殊函数&#xff0c;通过newFu…