HDFS简介

2023年6月12日上午6:17 • Python • 阅读 62

HDFS设计（Architecture）

原因：为了平衡数据的可靠性和写操作的花费

方法：默认副本数为3；

第一个副本在Client所处的节点上，若客户端在集群外，随机选一个；
第二个副本在另一个机架的随机一个节点
第三个副本在第二个副本所在机架的随机节点

注：NameNode不允许DataNode有两个相同的块，所以最大副本数量可根据DataNode数量决定。

存储对一每一个文件系统元数据做出的改变

整个文件系统名称空间，包括块与文件的映射，文件系统属性

背景：若每对文件做一次更改就写入到磁盘的FsImage中，会占用大量资源

解决方法：

启动时，从EditLog和FsImage中将名称空间与块映射读取到内存，将来自EditLog的所有事务写入到FsImage在内存中的代表，然后一起写入到磁盘上新的FsImage中，然后就可以截断老的EditLog。这个过程就称为检查点。
检查点在指定时间间隔或指定数量事务后触发。

心跳机制告诉了namenode，namenode跟踪哪些块需要被再拷贝然后开始行动。

客户端程序实现了checksum机制，当创建Hdfs文件时，会计算checksum，并存储在相同的Hdfs名称空间（就是Hdfs的同一个文件夹下），据此获得完整数据

高可用性（HA) ，启用多个NameNode

面试重点，我还没学到😁

后面的感觉不太重要，详情可参看官网

Original: https://www.cnblogs.com/pitaya01/p/15571626.html
Author: somelovelanguage
Title: HDFS简介

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/603267/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

.NET 反向代理-YARP 根据域名转发

前段时间发布过一个关于 YARP 的简单介绍，感兴趣的小伙伴恭请移步看看 .NET 反向代理-YARP – 一事冇诚 – 博客园 (cnblogs.com)…

Python 2023年10月21日
0036
电视剧里的代码真能运行吗？

大家好，欢迎来到 Crossin的编程教室！前几天，后台老有小伙伴留言”爱心代码”。这不是Crossin很早之前发过的内容嘛，怎么最近突然又被人翻出来了…

Python 2023年9月15日
0038
pd.read_csv/jieba.analyse.set_stop_words

目前网上能找到的方法都是自己做个停用词字典，然后在打印分词结果之前将停用词去掉。#也就是说分词的过程不变，打印时做个集合差运算。text =u’听说你超级喜欢万众掘金小…

Python 2023年8月8日
0045
MySQL日志（二）—— 启动MySQL日志（持续更新，目前仅启动二进制日志）

具体操作请看对应的MySQL版本。在安装MySQL时，会出现两个文件夹：Data和Install。而配置文件都在Data目录下面，配置文件里有MySQL的所有设置，改错一个就会造…

Python 2023年6月9日
0057
Web3中文｜AI机器人ChatGPT如何看待DeFi？

如果还没有玩过OpenAI最新的聊天机器人ChatGPT，那您真的应该体验一下。从电影推介到编程查询，ChatGPT几乎可以对您向它提出的任何提示做出类似人类的逻辑响应。这种新奇…

Python 2023年11月4日
0044
python3 Flask 多人答题(完整项目带源码与使用)

TopQB答题系统 2020/01/05@pingfan 功能：1、多人同时答题系统2、在线查看个人得分与答题情况（解析）3、载入题库，随机抽取题目支持【单选题，多选题，判断题】4…

Python 2023年8月14日
0054
matplotlib中legend图例的位置手动调整

matplotlib中legend图例的位置手动调整以饼状图中插入图例为例来调整图例legend的位置绘制一个饼状图 import matplotlib.pyplot as p…

Python 2023年9月3日
0052
动态关系图（html，直接可以单独html运行），方便集成项目

🍖🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖…

Python 2023年8月2日
0077
python教你写游戏超级玛丽，可运行有代码

一、先看效果：二、安装python3.92，pycharm编辑器 PyCharm 是一款功能强大的 Python 编辑器，具有跨平台性，鉴于目前最新版 PyCharm 使用教程较…

Python 2023年9月19日
0058
阿里云ECS磁盘扩容不生效处理办法

原因阿里云ECS云盘扩容后，在Linux服务器上没有生效实际需要几条命令扩容才能正式生效。处理方法先看扩容前磁盘空间， /dev/vda1可以看到只有40G。 df -Th …

Python 2023年6月11日
0071
pytest初级使用

1、python断言断言的写法： assert assert 2.pytest测试框架结构（setup teardown） setup_module/teardown_modul…

Python 2023年9月14日
0038
Python基于季节性自回归移动平均模型(SARIMA模型)进行时间序列分析建模项目实战

说明：这是一个机器学习实战项目（附带数据+代码+文档+视频讲解），如需数据+代码+文档+视频讲解可以直接到文章最后获取。 1.项目背景 SARIMA是季节性自回归移动平均模型。…

Python 2023年10月8日
0061
Flask整合html模板

“很多同学在DIY自己的web的时候，苦于没有优秀的前端辅助，无法做出好看实用的web，下面介绍一种现在比较实用的整合方法” 01 — Jinja2基本用法…

Python 2023年8月12日
0064
『迷你教程』Python中的函数式编程全方法详解

Python 是一种很棒的编程语言，是开发机器学习或数据科学应用程序的首选。Python 也很有趣，因为是一种多范式编程语言，可用于面向对象和命令式编程。具有简单的语法，易于阅读和…

Python 2023年8月8日
0070
pandas基础课程-实操（了解字段含义以及初步观察数据)

1.4 知道你的数据叫什么 1.4.1 任务一：pandas中有两个数据类型DateFrame和Series，通过查找简单了解他们。然后自己写一个关于这两个数据类型的小例子🌰 im…

Python 2023年8月22日
0045
dataframe排序中sort_values方法的使用—（超级详细）

1.sort_values（）方法 sort_values(by, axis=0, ascending=True, inplace=False, kind=’quick…

Python 2023年8月17日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

HDFS简介

HDFS设计（Architecture）

大家都在看