大数据
-
Hue4.10.0 安装并与Hdfs、Hive集成
HUE 第一部分Hue概述Hue(Hadoop User Experience)是一个开源的 Apache Hadoop UI系统,最早是由 Cloudera Desktop演化而…
-
认知实习Summary
自我介绍(Introduce) 我是来自兰州文理学院数字媒体学院,数据科学与大数据技术专业二班的浪浪 [En] I am from the School of Digital Me…
-
Hadoop_MapReduce架构
MapReduce 4.1 MapReduce原理 * 4.1.1 MapReduce概述 4.1.2 MapReduce的主要功能 4.1.3 MapReduce的处理流程 &#…
-
NoSQL 数据库 HBase
NoSQL 数据库 HBase 5.1HBase 原理 * 5.1.1 HBase 概述 5.1.2 HBase 核心概念 5.1.3 HBase 的关键流程 5.2 HBase …
-
分布式数据仓库 Hive
分布式数据仓库 Hive 7.1 Hive 概述 * 7.1.1 Hive 的定义 7.1.2 Hive 的设计特征 7.1.3 Hive 的体系结构 7.2 Hive 的伪分布式…
-
CQL和SQL的CRUD操作比较
数据进行CRUD操作时,CQL语句和SQL语句的异同之处。 1.建表 2.CRUD语句比较 3.总结 1.建表 在此之前先分别创建两张表,插入数据,用来测试然后进行比较 在SQL数…
-
cassandra表中主键的类型
cassandra表中主键的类型及区分? 一、类型及区分 二、参考文章 ; 一、类型及区分 Cassandra的4种Key Primary Key 主键 Composite Key…
-
数据挖掘之回归聚类算法总结
线性回归模型 回归分析 当变量之间存在互相依赖关系的时候,这时候可以进行回归分析。回归分析与相关分析在理论和方法上具有一致性,变量之间没有关系,就谈不上回归分析或者建立回归方程;相…
-
抓取每路公交的具体信息
1.抓取查询路径: 1 2 3 4 5 6 7 8 9 这里所看到的 href 属性值,加上 https://lanzhou.8684.cn/ 就是将来的查询地址。 以此抓取所有的…
-
python爬取百度图片
首先通过 urllib获取网页的源码 获取下一页的url链接,当本页的图片链接获取完毕,再继续获取下一页的。使用Python正则表达式匹配需要的字段 获取每一页的图片链接,将之放入…