数据湖之Hudi基础:集成Spark 2023年11月16日 下午8:43 • 大数据 • 阅读 64 原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/821456/ 转载文章受原作者版权保护。转载请注明原作者出处! 大数据 赞 (0) 0 生成海报 【自取】最近整理的,有需要可以领取学习: Linux核心资料大放送~ 全栈面试题汇总(持续更新&可下载) 一个提高学习100%效率的工具! 【超详细】深度学习面试题目! LeetCode Python刷题答案下载! LeetCode Java版刷题答案下载! LeetCode C++ 版本,抓紧保存! LeetCode GO语言 刷题答案下载! 大家都在看 位图介绍以及基本用法 bitop 语法:BITOP operation destkey key [key …] 对一个或多个保存二进制位的字符串 key 进行位操作,并将结果保存到 dest… 大数据 2023年6月2日 0083 Kafka消费者组再均衡问题 深入理解Kafka:核心设计与实践原理-朱忠华-微信读书https://weread.qq.com/web/reader/e9a32a0071848698e9a39b8 Kafka… 大数据 2023年5月28日 0096 kafka 常用操作 kafka-topics.bat –create –zookeeper localhost:2181 –replication-factor 1 –partiti… 大数据 2023年5月28日 0094 (1)Flink CEP复杂事件处理引擎介绍 复杂事件处理(CEP)既是把不同的数据看做不同的事件,并且通过分析事件之间的关系建立起一套事件关系序列库。利用过滤,聚合,关联性,依赖,层次等技术,最终实现由简单关系产生高级事件关… 大数据 2023年5月24日 0087 深度剖析 | 关于数据锁定和读取一致性问题 1 背景介绍 传统的 RDBMS 系统在三件事上值得注意:[TencentCloudSDKException] code:FailedOperation.ServiceIsolat… 大数据 2023年6月3日 00107 企业数字化转型思考系列文章(一)何为数字化转型? 导语 时下企业数字化转型浪潮风起云涌,富技术时代的各种新兴技术的加持下,企业或主动或被动都在数字化转型的实践之路上,各种打开方式也不尽相同,取得的成果也千差万别,使得企业不禁要持续… 大数据 2023年6月3日 0094 Vmware Station安装Arch Linux Vmware Station安装Arch Linux 一、测试环境及工具 二、下载arch linux镜像 三、vmware创建虚拟机 四、安装arch linux 1. 远程终端… 大数据 2023年5月27日 0094 入门大模型后,如何优化其输出结果?丨“悟道之巅”公开课实录(2) 扫描图上二维码或点击原文文末”阅读原文 “即可参赛! 如果你错过了上一波深度学习引发的NLP范式转换,不要再错过这一波超大预训练模型的崛起。 近日,R… 大数据 2023年5月28日 00136 GISFileMana 开源文件管理器 SQLiteFileMana > V1.3(发行版) &… 大数据 2023年11月11日 0065 IOS开发之——数据库-基础知识介绍(01) 一 概述 IOS中数据存储方式 SQLite数据库 使用Navicat执行表格操作 二 IOS中数据存储方式 Plist(NSArray\NSDictionary):只能存数据和字… 大数据 2023年11月10日 0059 Linux 使用 cp 命令强制覆盖功能 我们平时在 Linux 中使用 cp 命令时,当把文件从一个目录复制到另一个目录,且目录中具有同名文件时,系统会提示输入 y 来确认是否覆盖同名文件。 如果文件少的话,也无关紧要,… 大数据 2023年5月27日 0093 JuiceFS 在大搜车数据平台的实践 大搜车已经搭建起比较完整的汽车产业互联网协同生态。在这一生态中,不仅涵盖了大搜车已经数字化的全国 90% 中大型二手车商、9000+ 家 4S 店和 70000+ 家新车二网,还包… 大数据 2023年5月26日 00101 使用sqlcipher对sqlite数据库加密解密 文章目录 一、sqlite数据库加密 * 1.环境配置 二、更换数据库访问方式 * 1.获取DB 数据操作对象 2.修改构造方法 三、加密数据库解密 * 1.sqlcipher解密… 大数据 2023年11月11日 0068 [离线计算-Spark|Hive] HDFS小文件处理 HDFS 小文件过多会对hadoop 扩展性以及稳定性造成影响, 因为要在namenode 上存储维护大量元信息. 大量的小文件也可能导致查询分析性能不佳,因为查询引擎在执行查询时… 大数据 2023年5月26日 00105 数据智能——DTCC2022!中国数据库技术大会即将开幕 关注DTCC有几年了,还是在当中学到了很多的干货。今年我的大部分时间也都是投入在了数据治理的学习和数据治理工具的调研中。也非常渴望有这种机会去了解一下国内顶尖公司这方面的前沿技… 大数据 2023年6月2日 0097 数据治理之元数据管理的利器——Atlas入门宝典 随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为Hadoop生态最紧密的元数据管理与发现工具,Atlas在其中扮演着重要的位置。但是其官方文档不是很丰富… 大数据 2023年6月2日 0099