688IT编程网

688IT编程网是一个知识领域值得信赖的科普知识平台

数仓

尚硅谷数据仓库实战之3数仓搭建

2024-04-18 00:44:01

尚硅谷数据仓库实战之3数仓搭建数仓笔记数据仓库和数据集市详解:ODS、DW、DWD、DWM、DWS、ADS:尚硅谷数仓实战之1项目需求及架构设计:尚硅谷数仓实战之2数仓分层+维度建模:尚硅谷数仓实战之3数仓搭建:B站直达: 百度网盘: ,提取码:yyds 阿里云盘: ,提取码:335o第4章 数仓搭建-ODS层1)保持数据原貌不做任何修改,起到备份数据的作用。2)数据采用LZO...

数仓工程师工作内容

2024-02-06 04:35:37

数仓工程师工作内容后端工程师需要掌握哪些知识    随着大数据时代的到来,数据的规模和种类不断增加,数据的价值也变得越来越重要。数仓工程师作为一种新兴职业,主要负责数据仓库的设计、构建、维护和优化,以满足企业的数据分析和决策需求。本文将从数仓工程师的工作内容、技能要求和职业发展等方面进行详细介绍。    一、数仓工程师的工作内容    1...

Hadoop集小文件合并

2024-01-25 16:11:34

Hadoop集⼩⽂件合并Hadoop集运⾏⼀段时间后⼩⽂件越来越多,namenode不堪重负,不仅GC越来越频繁,还会偶尔挂掉Hadoop集⼤部分⽂件都来源于数仓,由于数仓未对相关配置进⾏优化,所以才会产⽣很多⼩⽂件为了解决⼩⽂件问题:优化hive参数mapredfiles=true(合并mr任务结果,开启后会新起⼀个mr...

传统数仓和大数据数仓的区别是什么?

2023-12-23 03:23:24

传统数仓和⼤数据数仓的区别是什么?这是我的第58篇原创⼀个圈⾥的朋友问,有很多传统数仓的朋友想转型⼤数据数仓,不知道该怎么办。问我能不能给讲讲课。准备⼀个课⽐较费劲,主要是得⾮常系统的讲。我这样⽇更,已经把所有的时间都占满了。那我就每天写⼀点,希望能帮助更多想转型⼤数据数仓的兄弟们。概念与容器为什么先说这个,其实很简单:因为绝⼤多数⼈都把这两个概念混为⼀谈。然后就会出现各种各样的问题:oracle...

上海校区大数据企业面试真题V1

2023-11-25 05:14:14

上海校区大数据企业面试真题版本:V1.4.0一、米哈游1.什么是Flink的非barrier对齐,如何实现?2.flink的内存管理?3.flink的序列化机制?4.flink提交job的方式以及参数如何设置? 页面提交和客户端提交有什么区别?5.你们flink集规模?6.flink提交作业的流程,以及与yarn是如何交互的?7.flink的checkpoint机制以及精准一次性消费如何实现?8...

最新文章