26_5 月_2023_第6页

完全分布式Hadoop2.X的搭建

准备工作：安装jdk 克隆2台虚拟机完成后：新的2台虚拟机，请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做：master、node1、node2 】（虚拟…

大数据 2023年5月26日

0092

Apache Atlas 架构图 Atlas 支持多数据源接入:Hive、HBase、Storm等 Type System Type Atlas 中定义了一些元数据类型 &…

大数据 2023年5月26日

0086

准备工作以及安装Hadoop之前的操作和Hadoop2.X的安装相同，在我上一篇博客中，这里不做过多介绍 https://www.cnblogs.com/lmandcc/p/153…

大数据 2023年5月26日

0053

云效能研发效能测评体系，如何展示和解读交付研发绩效数据，在一个迭代或一个周期结束时，团队需要回顾和推动研发绩效提升，并且需要在评审前展示团队当前的研发绩效数据。通过研发绩效测评来衡…

大数据 2023年5月26日

0070

这里介绍的几种常用基于密度聚类算法包括：DBSCAN、OPTICS、DENCLUE。 1. DBSCAN DBSCAN (Density Based Spatial Cluster…

大数据 2023年5月26日

0060

1.HDFS概述 1)数据量越来越多，在一个操作系统管辖的范围存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，因此迫切需要一种系统来管理多台机器上的文件，这…

大数据 2023年5月26日

0073

1.MapReduce概念 1）MapReduce是一种分布式计算模型，由Google提出，主要用于搜索领域，解决海量数据的计算问题. 2）MapReduce是分布式运行的，由两个…

大数据 2023年5月26日

0045

本次更新累计 80+ 提交，共有 9 位来自 JuiceFS 社区的小伙伴在 GitHub 上贡献代码。在这里，我们向每一位贡献者表示最诚挚的感谢，同时欢迎屏幕前的你也加入到 Ju…

大数据 2023年5月26日

0061

1、Hive完整建表 1 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name( 2 [(col_name data_type [C…

大数据 2023年5月26日

0067

1、使用JDBC连接Hive 1 import java.sql.Connection; 2 import java.sql.DriverManager; 3 import jav…

大数据 2023年5月26日

0054