按时间归档:2023年5月26日

  • 完全分布式Hadoop2.X的搭建

    准备工作: 安装jdk 克隆2台虚拟机完成后:新的2台虚拟机,请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做:master、node1、node2 】(虚拟…

    大数据 2023年5月26日
    092
  • [Apache Atlas] Atlas 架构设计及源代码简单分析

    Apache Atlas 架构图 Atlas 支持多数据源接入:Hive、HBase、Storm等 Type System Type Atlas 中定义了一些元数据类型 &…

    大数据 2023年5月26日
    086
  • 完全分布式Hadoop3.X的搭建

    准备工作以及安装Hadoop之前的操作和Hadoop2.X的安装相同,在我上一篇博客中,这里不做过多介绍 https://www.cnblogs.com/lmandcc/p/153…

    大数据 2023年5月26日
    053
  • 云效研发效能度量体系,如何展示和解读交付效能数据

    云效能研发效能测评体系,如何展示和解读交付研发绩效数据,在一个迭代或一个周期结束时,团队需要回顾和推动研发绩效提升,并且需要在评审前展示团队当前的研发绩效数据。通过研发绩效测评来衡…

    大数据 2023年5月26日
    070
  • 几种常用的基于密度的聚类算法

    这里介绍的几种常用基于密度聚类算法包括:DBSCAN、OPTICS、DENCLUE。 1. DBSCAN DBSCAN (Density Based Spatial Cluster…

    大数据 2023年5月26日
    060
  • HDFS原理深入理解

    1.HDFS概述 1)数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这…

    大数据 2023年5月26日
    073
  • MapReduce原理深入理解(一)

    1.MapReduce概念 1)MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题. 2)MapReduce是分布式运行的,由两个…

    大数据 2023年5月26日
    045
  • JuiceFS v0.17 发布,通过 1270 项 LTP 测试!

    本次更新累计 80+ 提交,共有 9 位来自 JuiceFS 社区的小伙伴在 GitHub 上贡献代码。在这里,我们向每一位贡献者表示最诚挚的感谢,同时欢迎屏幕前的你也加入到 Ju…

    大数据 2023年5月26日
    061
  • Hive语法及其进阶(一)

    1、Hive完整建表 1 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name( 2 [(col_name data_type [C…

    大数据 2023年5月26日
    067
  • Hive语法及其进阶(二)

    1、使用JDBC连接Hive 1 import java.sql.Connection; 2 import java.sql.DriverManager; 3 import jav…

    大数据 2023年5月26日
    054
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球