您当前的位置：首页 >> 大数据 > 正文

大数据NiFi（十一）：NiFi入门案例一

来源: 腾讯云时间：2023-01-13 13:32:40

NiFi入门案例一

需求：将A目录下实时产生的文件导入到指定的B目录下。

(资料图片)

这里需要使用到的处理器是“GetFile”和“PutFile”，完成以上需求对“GetFile”和“PutFile”相关属性进行配置。

一、配置“GetFile”处理器

1、拖拽“Processor”，搜索“GetFile”,创建处理器

2、双击“GetFile”处理器面板，打开配置，选择“PROPERTIES”进行配置

设置监控数据的目录，这里设置“/root/test/A”需要在集群中每个节点上预先创建好这个目录。

点击“Apply”，信息如下：

以上警告信息时当前处理器没有连接下游的任何处理器，后期我们将要连接“PutFile”处理器。

关于以上“GetFile”处理器的“Properties”配置的说明如下：

配置项	默认值	允许值	描述
Input Directory（数据输入目录）	[^\.].*		要提取文件的目录。
File Filter（文件过滤）			仅选择文件名与给定正则表达式匹配的文件。
Path Filter（路径过滤）			当“Recurse Subdirectories”为true时，只扫描路径与给定正则表达式匹配的子目录。
Batch Size（批量大小）	10		每次迭代要拉入的最大文件数。
Keep Source File（保留源文件）	false	truefalse	如果为true,则文件在复制到“Content Repository”后不会被删除。默认为false。
Recurse Subdirectories（递归子目录）	true	truefalse	是否递归从子目录获取文件。
Polling Interval（轮询间隔）	0 sec		设置执行目录列表之前需要等待多长时间。
Ignore Hidden Files（忽略隐藏文件）	true	truefalse	是否忽略隐藏的文件。
Minimum File Age（最小文件年龄）	0sec		设置要提取文件必须的最小年龄，任何比这个时间短的文件(根据最后修改日期)都将被忽略。
Maximum File Age（最大文件年龄）			设置要提取文件必须的最大年龄，任何比这个时间大的文件(根据最后修改日期)都将被忽略。
Minimum File Size（最小文件大小）	0 B		设置要提取文件所必须的最小大小。
Maximum File Size（最大文件大小）			设置要提取文件所必须的最大大小。

二、配置“PutFile”处理器

1、拖拽“Processor”，搜索“GetFile”,创建处理器

2、双击“PutFile”处理器面板，打开配置，选择“PROPERTIES”进行配置

设置数据流入当前处理器后写往的目录。

关于以上“PutFile”处理器的“Properties”配置的说明如下：

配置项	默认值	允许值	描述
Directory（数据写出目录）			要提取文件的目录。可以使用表达式，例如：/x1/x2/${path}。
Conflict Resolution Strategy(解决冲突策略)	fail	replaceignorefail	指示当输出目录中已经存在同名文件时应该如何处理。
Create Missing Directories（创建缺失目录）	true		如果为true，则将创建缺少的目标目录。如果为false，则流文件发送失败。
Maximum File Count（最大文件数）			指定输出目录中可以存在的文件的最大数量。
Last Modified Time（上次修改时间）			将输出文件的lastModifiedTime设置为此属性的值，格式必须为yyyy-MM-dd"T"HH:mm:ssZ，可以使用表达式，例如${file.lastModifiedTime}。
Permissions（权限）		truefalse	将输出文件的权限设置为此属性的值，格式必须是UNIX rwxrwxrwx，用-来代替被拒绝的权限(例如rw-r--r--)或八进制数字(例如644)，可以使用表达式，例如${file.permissions}。
Owner		truefalse	将输出文件的所有者设置为此属性的值，可以使用表达式语言，比如${file.owner}。注意:在许多操作系统上，Nifi必须以超级用户的身份运行，才能拥有设置文件所有者的权限。
Group			将输出文件上的组设置为此属性的值，可以使用表达式语言，例如${file.group}。

3、连接“GetFile”与“PutFile”处理器

经过连接处理器后，“PutFile”处理器还有警告如下：

双击“PutFile”,配置“SETTINGS”：

三、测试

在画布空白处点击右键，选择“Start”将“GetFile”和“PutFile”都启动起来，在Linux中node1、node2、node3节点任意一台节点“/root/test/A”目录下写入以下数据，也可以将现有文件移动到对应的目录下：

[root@node1 ~]# echo "aaa" > /root/test/A/a1.txt[root@node2 ~]# echo "bbb" > /root/test/A/a2.txt[root@node3 ~]# echo "ccc" > /root/test/A/a3.txt

刷新WebUI页面，显示数据成功被存入“/root/test/B”目录中。

在对应的node1、node2、node3节点上我们可以看到“/root/test/B”目录中有对应的数据。如果要停止以上处理器，可以在画布面板空白处右键选择“stop”将所有的处理器停止。

注意：数据写出的目录可以不需要提前在对应节点上创建，默认是可以自动创建，可以通过“Create Missing Directories”属性配置。如果写入的数据文件名称相同，这时可以配置属性“Conflict Resolution Strategy”为“replace”替换。

上一篇：生信学习小组Day2笔记-Chocolate Ice

下一篇：最后一页

精彩推荐

河南省成功发行政府债券169.581亿元 2022-09-14 17:53:42
河南：人工增雨“解渴”20℃风雨换季 2022-09-14 17:53:42
五省十窑唐三彩首次联展在郑州启幕 2022-09-14 17:53:43
河南汝州为何抽干湖水抓“怪鱼”？ 2022-09-14 17:53:43
河南汝州的“怪鱼”抓住了！是两条鳄雀鳝 2022-09-14 17:53:45
航空工业国企开放日系列活动在河南洛阳启动 2022-09-14 17:53:45
河南省首个元宇宙产业园落地郑州 2022-09-14 17:53:47
努力实现清仓见底，目前河南年度问题清单已解决3384项 2022-09-14 17:53:47
河南举行全国测绘法宣传日暨国家版图意识宣传周活动 2022-09-14 17:53:49
速查！2022年河南省“三支一扶”笔试成绩出炉 2022-09-14 17:53:49
同惠电子三季报业绩报告如何？同惠电子股票代码是什么？ 2022-10-31 10:53:29
克莱特三季报业绩报告如何？克莱特主营业务都有哪些？ 2022-10-31 13:35:08
中寰股份三季报业绩报告如何？中寰股份股票值得买吗？ 2022-10-31 13:44:49
大禹生物2022年三季报业绩报告如何？大禹生物股票值得买吗？ 2022-10-31 13:46:43
爱克信2022年三季报业绩报告如何？爱克信股票值得买吗？ 2022-10-31 13:50:12
嘉和融通2022年三季报业绩报告如何？嘉和融通代码是什么？ 2022-10-31 13:53:11
兆丰小贷2022年三季报业绩报告如何？兆丰小贷股票值得买吗？ 2022-10-31 13:55:47
如是集团2022年三季报业绩报告如何？如是集团主营业务是什么？ 2022-10-31 13:58:11
金恒新材2022年三季报业绩报告如何？金恒新材股票值得买吗？ 2022-10-31 13:59:52
汇湘轩2022年三季报业绩报告如何？汇湘轩代码是什么？ 2022-10-31 14:01:13
惊艳！“河南一号”太空摄影师发来首批河南图 2022-09-14 17:53:50
河南入选“双百企业”数量居全国第一方阵 2022-09-14 17:53:50
河南省正式启动2022年食品安全宣传周活动 2022-09-14 17:53:52
河南十项重大科技创新成果最新进展如何？ 2022-09-14 17:53:52
王凯在全省疫情防控电视电话会议上强调坚决打好疫情防控歼灭战织密织牢健康安全发展防线 2022-09-14 17:53:54
河南12项举措为企业纾困解难促进煤电行业持续健康发展 2022-09-14 17:53:56
速看！河南省2022年下半年自学考试报名须知 2022-09-14 17:53:56
河南普通本科、高职高专录取人数和增加幅度均创近年新高 2022-09-14 17:53:57
十年来，河南累计发放教育资助资金1153.3亿元 2022-09-14 17:53:57
新能源赛道4家龙头公司公布业绩预告三季报业绩均表现亮眼 2022-10-13 10:27:37
神火股份经营业绩爆发式增长公司电解铝产能释放 2022-10-13 10:35:15
三大股指低开高走沪指收盘重新站上3000点 2022-10-13 10:39:24
陕国投A转型发展回归本源积极强化信托主业创新 2022-10-13 10:40:17
A股上市公司科润智控发布前三季度业绩报告基本每股收益为0.21元 2022-10-31 09:57:54
晨光电缆发布前三季度业绩报告净利润同比增长28.12% 2022-10-31 09:59:29
智新电子三季报业绩报告如何？智新电子主营业务是什么？ 2022-10-31 10:03:45
天润科技2022年三季报业绩报告如何？天润科技基本每股收益为0.34元 2022-10-31 10:07:30
凯添燃气2022年三季报业绩报告如何？凯添燃气主营业务是什么？ 2022-10-31 10:11:35
丰光精密2022年三季报业绩报告如何？丰光精密主营业务是什么？ 2022-10-31 10:13:49
长虹能源2022年三季报业绩报告如何？长虹能源股票值得购买吗？ 2022-10-31 10:16:29
河南省财政下达资金3亿元支持黄河大保护 2022-09-14 17:53:59
王凯主持召开省政府常务会议研究稳经济保就业、现代职业教育高质量发展等工作决定向部分省辖市派出督导和服务工作组 2022-09-14 17:53:59
持续推进居家社区养老服务体系建设不断增强老年人获得感幸福感安全感 2022-09-14 17:54:01
第五届中国·河南招才引智创新发展大会驻马店专场研讨会召开 2022-09-14 17:54:01
十一届省委第二轮巡视分别召开进驻动员会 2022-09-14 17:54:03
前7个月全省实际使用外资同比增长391.6% 2022-09-14 17:54:03
河南启动第三次全国土壤普查外业调查采样 2022-09-14 17:54:04
河南29个科技小院获国家支持越来越多年轻人在村里“读研” 2022-09-14 17:54:04
河南省委统战工作会议在郑州召开楼阳生出席并讲话 2022-09-14 17:54:06
河南：家政失信、学术抄袭或将进入"黑名单" 2022-09-14 17:54:06

X 关闭

产品

两大巨头之间的握手！阿里巴巴与吉利宣布战略合作天天看点 2023-01-13

兔年限定！《英雄联盟》剪纸仙灵、春晖众神皮肤上线 2023-01-13

中国手游出海收入：《原神》遥遥领先 PUBG排名第二全球热资讯 2023-01-13

单季盈利破百亿！宁王商业版图盘点对外投资超百家 2023-01-13

全球微速讯：贾跃亭被恢复执行超11亿元又是合同纠纷待还80多亿 2023-01-13

X 关闭

消费

知识

经济

​NiFi入门案例一

一、​​​​​​​配置“GetFile”处理器

1、拖拽“Processor”，搜索“GetFile”,创建处理器

2、双击“GetFile”处理器面板，打开配置，选择“PROPERTIES”进行配置

二、配置“PutFile”处理器

1、拖拽“Processor”，搜索“GetFile”,创建处理器

2、双击“PutFile”处理器面板，打开配置，选择“PROPERTIES”进行配置

3、连接“GetFile”与“PutFile”处理器

三、​​​​​​​​​​​​​​测试

NiFi入门案例一

一、配置“GetFile”处理器

三、测试