最新发布 第50页

大数据学习,java,hadoop,spark,hive,数据仓库大数据学习,java,hadoop,spark,hive,数据仓库

书籍分享

DBeaver Enterprise 7.0 企业版激活方法

DBeaver Enterprise 7.0 企业版激活方法
DBeaver Enterprise 7.0 企业版激活方法=> DBeaver是一款优秀的数据库管理工具,支持管理众多数据库产品,巴拉巴拉 1.DBeaver Enterprise(简称DBeaverEE)支持MongoDB、Redis、Apache Hive等,但是需要付费使用。 软件下载地址https://dbeaver.io/d……继续阅读 »

Spark

SparkSQL 在有赞的实践

SparkSQL 在有赞的实践
前言 有赞数据平台从2017年上半年开始,逐步使用 SparkSQL 替代 Hive 执行离线任务,目前 SparkSQL 每天的运行作业数量5000个,占离线作业数目的55%,消耗的 cpu 资源占集群总资源的50%左右。本文介绍由 SparkSQL 替换 Hive 过程中碰到的问题以及处理经验和优化建议,包括以下方面的内容: 有赞数据平台的整体架构。 ……继续阅读 »

Kafka

总结kafka的consumer消费能力很低的情况下的处理方案

总结kafka的consumer消费能力很低的情况下的处理方案
spring-kafka是一个很好的用来操作kafka的库,并且可以和spring进行完美结合。 spring-kafka提供了一些kafka使用上功能的扩展。 相比于使用原生的kafka-client的api的话,使用更加简单,需要编写的码量更少。 最好能够使用最新的kafka(0.10.0)和spring-kafka(1.1.1.RELEASE)的版本 ……继续阅读 »

Spark

Spark源码:启动TaskScheduler

Spark源码:启动TaskScheduler
总结 调用 TaskSchedulerImpl.start 方法启动 TaskScheduler 时会调用 SchedulerBackend.start 方法启动 SchedulerBackend; SchedulerBackend 是 TaskScheduler 的后台线程,用于接收处理一些发给 TaskScheduler 的消息; StandaloneS……继续阅读 »