• 欢迎关注微信公众号:九万里大数据
  • 请使用Ctrl+D收藏本站到书签栏
  • 手机也可访问本站 jwldata.com

2021年04月的内容

大数据技术

Hive客户端安装配置(hive-1.1.0-cdh5.16.2)

Hive客户端安装配置(hive-1.1.0-cdh5.16.2)
虽然通过CDH控制台可以很方便地安装hive客户端,但如果客户端机器并不属于自己管辖,通过这种先安装cloudera manager agent再安装hive客户端的方式显然不妥当。在这种情形下,用户自己安装配置hive客户端,是最好的方式。安装JDK首先需要安装JDK配置hosts将服务端的hosts全部配置,添加到客户端的/etc/hosts中。……继续阅读 »

九万里大数据 1年前 (2021-04-30) 1248浏览 0评论5个赞

大数据技术

Spark客户端安装配置

Spark客户端安装配置
虽然通过CDH控制台可以很方便地安装spark客户端,但如果客户端机器并不属于自己管辖,通过这种先安装cloudera manager agent再安装spark客户端的方式显然不妥当。在这种情形下,用户自己安装配置spark客户端,是最好的方式。安装JDK首先需要安装JDK配置hosts将服务端的hosts全部配置,添加到客户端的/etc/host……继续阅读 »

九万里大数据 1年前 (2021-04-29) 955浏览 0评论4个赞

大数据技术

Hadoop客户端安装配置(hadoop-2.6.0-cdh5.16.2)

Hadoop客户端安装配置(hadoop-2.6.0-cdh5.16.2)
虽然通过CDH控制台可以很方便地安装hadoop客户端,但如果客户端机器并不属于自己管辖,通过这种先安装cloudera manager agent再安装hadoop客户端的方式显然不妥当。在这种情形下,用户自己安装配置hadoop客户端,是最好的方式。安装JDK首先需要安装JDK配置hosts将服务端的hosts全部配置,添加到客户端的/etc/h……继续阅读 »

九万里大数据 1年前 (2021-04-28) 1499浏览 0评论10个赞

大数据技术

完全分布式Hadoop集群搭建

完全分布式Hadoop集群搭建
之前我们讲过伪分布式Hadoop集群安装,但其实这种是单节点集群,并不是真正的分布式集群,只能用来学习和开发测试使用。今天我们从零开始搭建一个完全分布式Hadoop集群,包含了最关键的配置参数,可以直接用于生产环境。企业生产环境也仅仅是在我们今天讲的基础之上,加入了更多的安全性参数和性能调优参数而已。环境准备三台centos7.6虚拟机,配置2C4G 5……继续阅读 »

九万里大数据 1年前 (2021-04-23) 353浏览 0评论7个赞

大数据技术

Zeppelin的安装

Zeppelin的安装
下载安装包用户可以通过以下链接选择离自己较快的源下载安装包。http://www.apache.org/dyn/closer.cgi/zeppelin/zeppelin-0.9.0/zeppelin-0.9.0-bin-all.tgzall interpreter package包含了所有的解释器,安装包体积1.5G清华源下载地址:https://……继续阅读 »

九万里大数据 1年前 (2021-04-09) 394浏览 0评论2个赞

大数据技术

ClickHouse高可用集群安装配置和创建分布式表

ClickHouse高可用集群安装配置和创建分布式表
ClickHouse也可以做分布式部署,拥有shard和replica的概念,类似elasticsearch,但是在配置上面要复杂许多,之前介绍过单节点ClickHouse的安装和ClickHouse导入测试数据集,这里在此基础上继续介绍ClickHouse集群化安装配置,创建一个分布式表,并往分布式表里导入测试数据。3shards_1replicas3……继续阅读 »

九万里大数据 1年前 (2021-04-08) 449浏览 0评论1个赞