5 2023年6月3日 下午7:49 • 大数据 • 阅读 101 Copyright © 2023 PepsiPowered by .NET 7.0 on Kubernetes Original: https://www.cnblogs.com/dty602511/p/16178722.htmlAuthor: PepsiTitle: 5 原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/565694/ 转载文章受原作者版权保护。转载请注明原作者出处! 大数据 赞 (0) 0 生成海报 【自取】最近整理的,有需要可以领取学习: Linux核心资料大放送~ 全栈面试题汇总(持续更新&可下载) 一个提高学习100%效率的工具! 【超详细】深度学习面试题目! LeetCode Python刷题答案下载! LeetCode Java版刷题答案下载! LeetCode C++ 版本,抓紧保存! LeetCode GO语言 刷题答案下载! 大家都在看 OKR之剑(理念篇)02—— OKR布道之旅 作者:vivo互联网平台产品研发团队 1、我们是如何引入的 1.1、企业文化匹配 大概是在2013年底,一些创业者在硅谷深受OKR洗礼,并在自己的公司内小范围运用,以此OKR开始传… 大数据 2023年6月2日 0086 彻底搞懂 Hive|Spark DDL语句 | ALTER 语法 Hive|Spark DDL语句 | ALTER 语法 * – SQL Syntax – DDL Statements:SQL语法之DDL语句 –… 大数据 2023年11月13日 0083 6 Copyright © 2023 PepsiPowered by .NET 7.0 on Kubernetes Original: https://www.cnblogs.com/… 大数据 2023年6月3日 0093 Flink TableAPI更新模式 更新模式 在流处理过程中,表的处理并不像传统定义的那样简单。 对于流式查询(Streaming Queries),需要声明如何在(动态)表和外部连接器之间执行转换。与外部系统交换的… 大数据 2023年5月25日 0081 sqoop把hive中的数据导入mysql 使用sqoop将hive中的数据导入mysql中 记录简单案例 首先开启集群: start-all.sh 在hive中建库建表,并插入一条数据来为自己做实验: 验证一下,是否插入成… 大数据 2023年11月13日 0045 ElasticSearch中的JVM性能调优 ElasticSearch6.3.2 中的JVM性能调优 前一段时间被人问了个问题:在使用ES的过程中有没有做过什么JVM调优措施? 在我搭建ES集群过程中,参照important… 大数据 2023年5月28日 0088 Python|使用sqlite3第三方库读写SQLite数据库 1 数据概览 2 任务定义 基于学生课程成绩文件,使用pandas和sqlite3将学生信息输入SQLite数据库,请在完成对应数据库操作后分析学生课程成绩信息,计算各科目平均分并… 大数据 2023年11月10日 0036 【云原生】zookeeper + kafka on k8s 环境部署 一、概述 二、Zookeeper on k8s 部署 1)添加源 2)修改配置 3)开始安装 4)测试验证 5)Prometheus监控 6)卸载 三、Kafka on k8s 部… 大数据 2023年6月3日 0066 Hive的基本操作之表分区 由于hive在查询时会做全表扫描,有些情况下我们只需要查询部分数据,为了避免全表扫描消耗资源和性能,我们可以实现表分区使之扫描部分表。 在hive中分区字段是一个伪字段,并不实际存… 大数据 2023年11月13日 0057 索引分类与适用场景 一、分类 数据库索引好比是一本书前面的目录,能加快数据库的查询速度。索引分为 聚簇索引和 非聚簇索引两种,聚簇索引 是按照数据存放的物理位置为顺序的,而非聚簇索引就不一样了;聚簇索… 大数据 2023年11月11日 0034 自然语言处理-gensim Gensim 是 Python 的一个三方库,旨在从文档中自动提取语义主题,以及处理原始的非结构化数字文本( 纯文本… 大数据 2023年5月28日 0079 Hadoop或hive用户名和本地主机用户名不一样,不能读写 简介:解决Hadoop或hive集群用户名不一样不能读写,配置了用户名不生效的问题。解决spark跨集群写hive、hdfs用户名不一致,不能读写的问题。 一、配置用户名 这种情况… 大数据 2023年11月12日 0030 Elasticsearch(二)–集群原理及优化 一、ES原理 1、索引结构ES是面向文档的 各种文本内容以文档的形式存储到ES中,文档可以是一封邮件、一条日志,或者一个网页的内容。一般使用 JSON 作为文档的序列化格式,文档可… 大数据 2023年5月26日 0092 docker项目ssl 安全证书的种种 一,证书挂着宿主的nginx上 这个很简单,只需要修改宿主nginx的配置文件即可 server { listen 443 ssl default; server_name www… 大数据 2023年5月29日 0090 BERT参数量计算 目前,预训练模型在NLP领域占据核心地位。预训练模型的参数量是庞大的,例如BERT(base)的参数量是110M,BERT(large)的参数量是330M。为了深入认识,我决定思考… 大数据 2023年5月28日 00101 Java从SQLite库的表中读取Blob类型数据,并使用GeomFromText()函数将数据存入MySQL表的wkt字段,类型为geometry 一.背景概述 本周接到一个需求,需要将SQLite中一张表的数据迁移到MySQL库里,拆分为多张表存放数据。SQLite中的迁移对象表为:tm_world_region,其表结构如… 大数据 2023年11月10日 0049