Spark参数解说 2023年11月16日 下午11:02 • 大数据 • 阅读 64 原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/821546/ 转载文章受原作者版权保护。转载请注明原作者出处! 大数据 赞 (0) 0 生成海报 【自取】最近整理的,有需要可以领取学习: Linux核心资料大放送~ 全栈面试题汇总(持续更新&可下载) 一个提高学习100%效率的工具! 【超详细】深度学习面试题目! LeetCode Python刷题答案下载! LeetCode Java版刷题答案下载! LeetCode C++ 版本,抓紧保存! LeetCode GO语言 刷题答案下载! 大家都在看 AI+金融驱动金融信创“芯”生态 “十四五”规划纲要提出,要健全具有高度适应性、竞争力、普惠性的现代金融体系,有序推进金融创新,稳妥发展金融科技,加快金融机构数字化转型,这标志着金融领域的科… 大数据 2023年5月24日 0083 Docker安装与基础操作 脚本自动安装Docker 安装命令如下: curl -fsSL https://get.docker.com | bash -s docker –mirror Aliyun de… 大数据 2023年6月3日 0077 CDH集群使用spark作为hive查询引擎(实时查询) Hive我们用来搭建数仓,对于大量数据以及离线数仓,可以满足,但是 他不能满足实时查询的情况,如果这次客户来了个需求,不在我们统计分析的指标内。 那你单独写SQL,然后通过mr底层… 大数据 2023年11月13日 0059 沙盒和App Group 1.沙盒机制 沙盒也叫沙箱,英文standbox,其原理是通过重定向技术,把程序生成和修改的文件定向到自身文件夹中。在沙盒机制下,每个程序之间的文件夹不能互相访问。iOS系统为了保… 大数据 2023年11月10日 0035 HTTP基础知识总结 目录 HTTP的请求方法及其作用 GET和POST有什么区别? PUT和POST都是给服务器发送新增资源,有什么区别? PUT和PATCH都是给服务器发… 大数据 2023年5月26日 0057 Linux中的grep,sed,find的使用方法 提取指定文件到指定目录/文件 语法:tar xvf test.tar test1(只提取test.tar 包中的test1文件到当前路径) 语法:tar xvf test.tar … 大数据 2023年5月27日 00112 安装centos8.5的配置步骤 安装centos8.5的配置步骤 安装centos8.5的配置步骤 在已经安装了vmware workstation的基础上进行如下操作 1.创建虚拟机(选择自定义) 2. 默认硬… 大数据 2023年5月27日 0069 Cloud ❀ 数据中心的构建与管理 Cloud ❀ 数据中心的构建与管理 原创 无糖可乐没有灵魂2022-06-24 20:58:33©著作权 文章标签 数据中心 数据 信息系统 文章分类 Hadoop 大数据 ©著… 大数据 2023年5月26日 0065 springcloud微服务国际化 大数据 2023年11月15日 0038 centos6.5 squid安装 squid作用 1 正向代理 标准的代理缓冲服务器,须在每一个内部主机的浏览器上明确指明代理服务器的IP 地址和端口号。 透明代理缓冲服务器,代理操作对客户端的浏览器是透明的(即不… 大数据 2023年6月3日 0064 自然语言处理学习笔记十一(文本分类) 在文本聚类中,体验了无须标注语料库的便利性,但是无监督学习总归无法按照我们的意志预测出文档的类别,限制了文本聚类的应用场景。为了解决更多的需要将文档分门别类地归入具体的类别中,于是… 大数据 2023年5月28日 0080 论文解读:NSP-BERT: A Prompt-based Zero-Shot Learner Through an Original Pre-training Task——Next Sentence 论文解读:NSP-BERT: A Prompt-based Zero-Shot Learner Through an Original Pre-training Task——Nex… 大数据 2023年5月28日 0086 docker容器网络 docker容器网络 docker容器网络 容器的四种网络模式 bridge模式 container模式 host模式 none模式 容器的四种网络模式配置 bridge模式配置 … 大数据 2023年5月27日 0063 Linux中文件/文件系统的压缩、打包和备份总结(基于rhel7) Linux有哪些压缩工具可供选择 按压缩比:xz>bzip2>gzip,按压缩时长:gzip<bzip2<xz,另外还有zip可以选择。 gzip只负责压缩没有打包功能… 大数据 2023年5月27日 0074 大数据平台——离线数据 一、什么是离线数据 数据从业务端产生,到分析或者反哺业务使用,需要经过一系列的清洗、处理过程,而这一过程带来时间窗口大小,就是数据的时效性。按照数据延迟的大小,可以将数据分为离线数… 大数据 2023年11月13日 0062 【flink学习笔记】【6】Sink 输出算子 大数据 2023年11月15日 0051