从HDFS和MapReduce两方面了解Hadoop
不出意外的话,你可以在控制台看到你指定文件的内容。在这一步我遇到一个问题,就是无法直接在 windows 下操作 HDFS,具体的解决方法可以参照这篇文章。FSDataInputStream.seek()方法还可以实现从文件输入流的任意一个绝对位置读取文件内容,比如我们可以在上面代码中添加如下的内容来实现在控制台重复打印文件内容。
创建目录。
查询文件目录。
这里引入一个类 FileStatus,这个类封装了 HDFS 中文件和目录的元数据,包括文件长度、块大小、复本、修改时间、所有者以及权限信息。FileSystem 里面提供的 listStatus 方法可以获取一个目录下的所有目录或者文件的 FileStatus,但是它不会递归获取下级目录的内容,这里可以开发你的想象自己实现一下(Tips:fileStatus.isDirectory()可以判断这个 fileStatus 是否是一个文件夹)。 删除文件或目录。
我们可以看到 fs.delete()这个方法有两个参数,第一个参数很好理解,就是我们要删除的目录或者文件的地址。那么第二个 Boolean 类型的参数呢,如果删除的是文件或者空目录这个参数实际上是会被忽略的,如果删除的是非空目录,只有在这个参数值为 true 的时候才会成功删除。 创建文件和文件写入。 我们通过 FileSystem.create()方法来创建一个文件,这个方法会顺带着创建不存在的父级目录,如果不需要这个的话,最好是在创建之前调用 exists()方法来判断一下,如果父级目录不存在直接报错即可。
文件创建好后,可以通过 append()方法在文件末尾添加内容。
从本地上传文件到 HDFS。
从 HDFS 上下载文件。
MapReduce 实战 什么是 MapReduce (编辑:汕尾站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- visual studio code怎么制作c++程序 安装扩展即可
- CES2020:Nreal Light成功斩获“最佳混合现实设备”奖
- 5G取代WiFi?短期不可能,另外别忘了WiFi也在升级
- VR射击游戏《Firewall Zero Hour》发布最新更新包
- 隐秘的暴利:玩车玩出近2000亿,个性化汽车后市场藏着新蓝海
- AR游戏《Secret Oops》登陆ARKit平台支持多人共享体验
- 5G发牌一周年:行业应用加速融合 超高清、VR/AR将率先爆发
- 第一人称MOBA游戏《Megalith》正在开发PCVR版本
- 技术跨界:当AI遇见VR/AR,会发生什么?
- Google Poly内置VR工具支持可视化3D对象