数仓治理的老大难,通常是跟着业务需求快跑,要不是数据零散在各个团队,或者是大家的研发规范有不同,作为一项通过维度模型来约束规范的工种来讲,“模型”的治理难度,大于“架构”。
……继续阅读 »
翻译 | 高赟Review | 朱翥、马国维
Flink 1.13 发布了!Flink 1.13 包括了超过 200 名贡献者所提交的 1000 多项修复和优化。
这一版本中,Flink 的一个主要目标取得了重要进展,即让流处理应用的使用像普通应用一样简单和自然。Flink 1.13 新引入的被动扩缩容使得流作业的扩缩容和其它应用一样简单,用户仅需……继续阅读 »
1.Hive事务做了什么改进?
2.Spark与Hive集成提供了什么组件?
3.Hive安全性默认使用什么?
这个版本中有什么新东西:Apache Hive
hvie 3.1包括物化视图的分区,这可以提高查询响应能力和维护修复。
……继续阅读 »
【转载】实时数仓在滴滴的实践和落地
……继续阅读 »
【翻译】Flink Table API & SQL 自定义 Source & Sink
……继续阅读 »
源码解析 | 万字长文详解 Flink 中的 CopyOnWriteStateTable
……继续阅读 »
ClickHouse 数据类型介绍
……继续阅读 »
迁移你的业务到ClickHouse迁移你的业务到ClickHouse1.什么时候迁移?2.如何迁移?
……继续阅读 »
hive,hql,sql,大数据,学习,大数据求职
……继续阅读 »
hive,sql collect_set及array_contain,大数据
……继续阅读 »