二、HDFS学习

2023年5月26日上午1:17 • 大数据 • 阅读 64

Hadoop Distributed File System 简称HDFS 一、HDFS设计目标

二、HDFS学习

2、一次写多次读 3、运行在普通的硬件上面 4、数据块尽量散步到各个节点中

二、HDFS不适合的场景

1、不适合低延迟的数据，对一个大文件整个文件进行读取，即批量读取而非随机读取 2、小文件 3、无法对文件的内容任意修改

三、HDFS架构

1、一个文件被划分成大小固定的多个文件块，分布的存储在集群中的节点中

二、HDFS学习

二、HDFS学习

二、HDFS学习

二、HDFS学习

二、HDFS学习

二、HDFS学习

二、HDFS学习

四、总结

1、Block：一个文件分块，默认为64M 2、NameNode：保存整个文件的目录信息、文件信息以及文件相应的分块信息，如果namenode支持很多的datanode数据节点信息时，因为读取任意一个文件都需要从namenode中读取信息，那读取namenode就将是文件读取的瓶颈，所以为了避免这个问题的出现，一般将namenode的信息保存到内存中，同时将一些信息持久化到磁盘中，防止读取失败时有备份信息。 3、DataNode：用于存储Blocks 4、HDFS的HA策略：NameNode一旦宕机，整个文件系统将无法工作。如果NameNode中的数据丢失，整个文件系统也就丢失了。所以从hadoop2.x开始，HDFS支持NameNode的active-standy模式，就是同时开启多个namenode当active模式工作时，standy模式会同步active所有的信息，当active不能工作时，standy就会转变为active模式来接管namenode。

作者：少帅

您的支持是对博主最大的鼓励，感谢您的认真阅读。

本文版权归作者所有，欢迎转载，但请保留该声明。

Original: https://blog.51cto.com/u_15683012/5383551
Author: 大数据工匠
Title: 二、HDFS学习

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/517410/

转载文章受原作者版权保护。转载请注明原作者出处！

赞 (0)

0

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Android 6.0 修改屏幕

Android 6.0 修改屏幕原创 51CTO王睿丶2022-06-18 01:16:35©著作权文章标签 Android Rom开发王睿丶 framework 修改屏幕 …

大数据 2023年5月26日
0067
hive数据倾斜的原因和解决方法

1、数据倾斜表现：任务执行时，有1个或几个任务的进度长时间维持在99%，导致任务无法结束。 2、数据倾斜类型和解决方案（1）join 倾斜 *大小表join 使用map joi…

大数据 2023年11月13日
0038
学习mysql中遇到的问题以及解决（一）

学习mysql中遇到的问题以及解决（一）问题1：字段加上单引号’ ‘ 就报错啦，去掉单引号’ ‘就正常了问题2：default …

大数据 2023年5月26日
0097
【Redis】arm64架构，docker的Redis出现Failed to test the kernel for a bug that could lead to data corruption

大数据 2023年11月15日
0047
大白话带你认识JVM(转)

摘自：https://www.cnblogs.com/max-home/p/12270183.html 前言如果在文中用词或者理解方面出现问题，欢迎指出。此文旨在提及而不深究，但…

大数据 2023年5月28日
0070
mac系统下Redis安装和使用步骤详解

大数据 2023年11月15日
0052
flink1.13 sql基础语法（二）join操作

大数据 2023年11月14日
0029
JVM 调优案例分析1

1 案例资料案例程序在stock.zip中http://download.csdn.net/detail/jingshuaizh/9234175 Requirements jdk…

大数据 2023年5月28日
0061
Linux firewall 常用命令

linux firewall防火墙放行端口 firewall-cmd –zone=public –add-port=xxxx/tcp –permanent –zo…

大数据 2023年5月27日
0057
Hive架构图

大数据 2023年11月13日
0041
Redis分片

大数据 2023年11月15日
0039
HIVE基础-文件存储格式

Hive的文件存储格式文件主要存储格式有四种：textfile、sequencefile、orc、parquet 在Hive建表的时候可以指定文件存储格式，具体可见：HIVE操作…

大数据 2023年11月13日
0041
SQLite学习之路⑩ 互斥锁（2021SC@SDUSC）

SQLite 学习之路第十节互斥锁 2021SC@SDUSC 互斥锁部分由mutex.c、mutex_w32.c、mutex_unix.c和mutex_noop.c实现 mut…

大数据 2023年11月11日
0040
手把手教你搭建惊艳的博客

[TOC](文章目录) 前言相信大多数人都有建立自己博客网站的想法，所以这篇文章一步步齐头并进，最终结果类似于以下几点： [En] It is believed that mos…

大数据 2023年5月27日
0082
ERROR tool.ImportTool: Import failed: java.io.IOException: Hive exited with status 1

sqoop的迁移数据到hive的报错常见原因：原因1：未将hive中的hive-common-.jar ,hive-exec-.jar（为你的hive下的文件号）以及mys…

大数据 2023年11月13日
0079
1169. Invalid Transactions**

1169. Invalid Transactions** 题目描述 A transaction is possibly invalid if: the amount exceeds…

大数据 2023年5月26日
0080

亲爱的 Coder【最近整理，可免费获取】👉 最新必读书单 | 👏 面试题下载 | 🌎 免费的AI知识星球