按时间归档:2023年5月26日
-
完全分布式Hadoop2.X的搭建
准备工作: 安装jdk 克隆2台虚拟机完成后:新的2台虚拟机,请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做:master、node1、node2 】(虚拟…
-
[Apache Atlas] Atlas 架构设计及源代码简单分析
Apache Atlas 架构图 Atlas 支持多数据源接入:Hive、HBase、Storm等 Type System Type Atlas 中定义了一些元数据类型 &…
-
完全分布式Hadoop3.X的搭建
准备工作以及安装Hadoop之前的操作和Hadoop2.X的安装相同,在我上一篇博客中,这里不做过多介绍 https://www.cnblogs.com/lmandcc/p/153…
-
云效研发效能度量体系,如何展示和解读交付效能数据
云效能研发效能测评体系,如何展示和解读交付研发绩效数据,在一个迭代或一个周期结束时,团队需要回顾和推动研发绩效提升,并且需要在评审前展示团队当前的研发绩效数据。通过研发绩效测评来衡…
-
几种常用的基于密度的聚类算法
这里介绍的几种常用基于密度聚类算法包括:DBSCAN、OPTICS、DENCLUE。 1. DBSCAN DBSCAN (Density Based Spatial Cluster…
-
HDFS原理深入理解
1.HDFS概述 1)数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这…
-
MapReduce原理深入理解(一)
1.MapReduce概念 1)MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题. 2)MapReduce是分布式运行的,由两个…
-
JuiceFS v0.17 发布,通过 1270 项 LTP 测试!
本次更新累计 80+ 提交,共有 9 位来自 JuiceFS 社区的小伙伴在 GitHub 上贡献代码。在这里,我们向每一位贡献者表示最诚挚的感谢,同时欢迎屏幕前的你也加入到 Ju…
-
Hive语法及其进阶(一)
1、Hive完整建表 1 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name( 2 [(col_name data_type [C…
-
Hive语法及其进阶(二)
1、使用JDBC连接Hive 1 import java.sql.Connection; 2 import java.sql.DriverManager; 3 import jav…