自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Alice菌的博客

大数据 | 程序人生 | 公众号【猿人菌】| 个人网站 : http://alices.ibilibili.xyz/ | 乾坤未定,你我皆是黑马!...

原创 全网最全Python学习路线图+14张思维导图,让python初学者不走弯路!

        最近忙着做大数据的项目,故有一段时间没更新Python专栏的内容了。         突发奇想,想把当初自学python时...

2019-12-28 00:51:03 24132 120

原创 大数据技术原理与应用之【流计算】习题

1.试述流数据的概念 流数据,即数据以大量、快速、时变的流形式持续到达。 2.试述流数据的特点 流数据具有如下特征: 数据快速持续到达,潜在大小也许是无穷无尽的 数据来源众多,格式复杂 数据量大,但是不十分关注存储,一旦经过处理,要么被丢弃,要么被归档存储 注重数据的整体价值,不过分关注个别数据...

2019-12-29 22:56:44 2390 0

原创 大数据技术原理与应用之【大数据处理架构Hadoop】习题

1.试述hadoop和谷歌的mapreduce、gfs等技术之间的关系 答: Hadoop的核心是分布式文件系统HDFS和MapReduce,HDFS是谷歌文件系统GFS的开源实现,MapReduces是针对谷歌MapReduce的开源实现。 2.试述Hadoop具有哪些特性。 答: 高可靠性,高...

2019-12-29 21:24:19 2525 0

原创 大数据技术原理与应用之【HDFS】习题

1.试述分布式文件系统设计的需求。 设计需求 含义 HDFS的实现情况 透明性 具备访问透明性、位置透明性、性能、和伸缩透明性 只能提供一定程度的访问透明性,完全支持位置透明性、性能和伸缩透明性 并发控制 客户端对于文件的读写不应该影响其他客户端对同一个文件的读写 机制非常简单...

2019-12-29 18:56:15 2702 0

原创 Unable to read additional data from server sessionid 0x0解决

        今天在一个节点上进入到zookeeper命令行时,报了下面这个异常! 后来经过查找了资料才明白,我集群上安装了3台zookeeper。 zookeeper有个选举算法,当整个集群超过半数机器宕机,zo...

2019-12-29 11:41:32 3741 0

原创 大数据技术原理与应用之【云数据库】习题

1.试述云数据库的概念。 答:云数据库是部署和虚拟化在云计算环境中的数据库。云数据库是在云计算的大背景下发展起来的一种新兴的共享基础架构的方法,它极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易,同时,也虚拟化了许多后端功能。云数据库具有高可扩展性、高可用...

2019-12-29 00:48:55 2836 0

原创 Phoenix的索引介绍与创建

        在海量数据背景下,查询数据快速返回是典型的应用场景。在phoenix数据表基础之上创建索引,能够大幅提高数据的查询效率。Phoenix支持的索引有三个类型,分别是覆盖索引、全局索引、本地索引。 &nbs...

2019-12-29 00:20:40 2108 20

原创 用ImageGrab.grabclipboard()获取的图片时出现错误AttributeError: 'NoneType' object has no attribute 'save'解决方案

        今天使用Python图像处理库ImageGrab,在调用==grabclipboard()==方法获取到剪切板上图片的时候报了这个让我懵圈了的异常~~ 后来查了官方文档才知道,grabclipboar...

2019-12-28 17:47:11 3243 1

原创 Phoenix的使用方式详解

        本篇博客小菌为大家分享的是关于Phoenix的使用方式与常用shell。         前文传送门:《Phoenix(凤...

2019-12-28 10:53:13 2142 20

原创 Phoenix(凤凰)的安装介绍

        本篇博客,小菌为大家带来的是关于Phoenix的入门介绍及安装说明。          Phoenix 介绍  ...

2019-12-28 00:17:38 2091 16

原创 把本地的文件数据导入到Hive分区表--系列①Java代码

        本篇博客,小菌为大家带来关于如何将本地的多个文件导入到Hive分区表中对应的分区上的方法。一共有四种方法,本篇将介绍第一种—Java代码。      &...

2019-12-25 23:31:02 2995 2

转载 大数据学习体系说明

大数据需要学习什么?很多人问过我这个问题。总是没有一个合适的契机去好好总结这些内容,大数据是近五年兴起的行业,发展迅速,很多技术经过这些年的迭代也变得比较成熟了,同时新的东西也不断涌现,想要保持自己竞争力的唯一办法就是不断学习。 干货走起,闲话不多说,以下就是小编整理的大数据学习思路附上学习路线图...

2019-12-22 22:07:43 2619 0

原创 HBase:Region管理与Master工作机制

        本篇博客小菌为大家带来的是HBase的Region管理与Master工作机制。 region 的管理         首先...

2019-12-22 21:22:56 2721 8

原创 HBase的读写流程

        本篇博客小菌为大家带来的是关于HBase的读写路程的介绍。          读请求流程 在介绍之前先为大家科普几个前提!...

2019-12-22 20:39:32 2615 9

原创 io.UnsupportedOperation: not writable异常解决

        今天在做python语感练习的时候,报了如下异常: 就是这个红彤彤的异常 io.UnsupportedOperation: not writable 翻译一下,意思是不支持写入的权限。仔细检查了一下,...

2019-12-22 11:33:18 18617 21

原创 大数据技术原理与应用之【NoSQL数据库】习题

1.如何准确理解NoSQL的含义?         NoSQL是一种不同于关系数据库的数据库管理系统设计方式,是对非关系型数据库的一类统称,它采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关...

2019-12-21 11:26:02 3953 0

原创 HBase的rowKey设计技巧

        本篇博客小菌为大家带来的是HBase的rowKey设计技巧!         HBase是三维有序存储的,通过rowkey...

2019-12-20 23:31:16 2611 8

原创 HBase的预分区介绍及设置

        本篇博客小菌为大家带来关于HBase的预分区的内容分享!         在正式开始介绍之前,我们先联系一下之前所学的内容...

2019-12-20 23:05:12 2791 8

原创 HBase的3个重要机制

        本篇博客,小菌为大家带来的是关于HBase的3个重要机制。          1.flush 机制 1.(hbase.re...

2019-12-18 16:28:00 2888 8

原创 HBase的JavaAPI使用--进阶篇--过滤器的使用

        本篇博客,小菌为大家带来HBase的进阶使用,关于基础入门操作大家可以去阅览小菌之前的博客《HBase的JavaAPI使用–基础篇》。      &nb...

2019-12-18 13:43:40 3124 8

原创 org.apache.hadoop.hbase.TableNotDisabledException异常解决

        今天在使用JavaAPI操作HBase,当删除数据表时,程序运行报了这个异常。         org.apache.ha...

2019-12-18 11:23:20 3399 0

原创 HBase的JavaAPI使用--基础篇

        本篇博客小菌为大家带来的是关于HBase的JavaAPI使用。 创建项目,导入pom <repositories> <repository> ...

2019-12-17 17:45:04 3154 0

原创 HBase使用JavaAPI连接出现java.io.IOException: java.lang.reflect.InvocationTargetException异常解决

        今天在使用JavaAPI连接HBase,运行时出现了这个异常。             &n...

2019-12-17 16:35:01 3808 1

原创 HBase简答题(持续更新)

1.HBase的基本介绍 a.Hbase是建立在hdfs之上的一个数据库, b.不支持join等SQL复杂操作 c.支持的数据类型:byte[], d.依靠横向扩展,一个表可以有上十亿行,上百万列。 e.面向列(族)的存储和权限控制 f.对于为空(null)的列,并不占用存储空间,是一个稀疏表。 ...

2019-12-16 18:15:51 3355 0

原创 读书笔记摘抄(5)

        没有人活在保鲜膜中         没有人能永葆青春      &nbs...

2019-12-15 23:34:22 3076 0

转载 Apache Kylin(麒麟)入门介绍

为什么需要Kylin?      &n...

2019-12-15 22:31:15 3138 0

转载 一文读懂Apache Kylin(麒麟)

“麒麟出没,必有祥瑞。”                               —— 中国古谚语 Kylin思维导图 前言 随着移动互联网、物联网等技术的发展,近些年人类所积累的数据正在呈爆炸式的增长,大数据时代已经来临。但是海量数据的收集只是大数据技术的第一步,如何让数据产生价...

2019-12-15 22:26:33 3174 0

原创 Sqoop入门介绍及安装

介绍         Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。       ...

2019-12-15 19:58:57 3112 0

原创 大数据技术原理与应用之【Spark】习题

1.Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。 答:Spark具有如下4个主要特点: ①运行速度快;②容易使用;③通用性;④运行模式多样。          2.Spark的出现是为了解决Ha...

2019-12-15 19:15:06 4798 2

原创 11个“高能”网站,学编程和赚钱两不误!

0.GitHub — 开发者最最最重要的网站:https://github.com 这个不用多说了吧,代码托管网站,上面有很多资源,想要什么轮子,上去搜就好了。并且呢,上面有很多优秀的程序员,你可以在这里交到很多好朋友喔。 1.掘金 帮助开发者成长的技术社区:https://juejin.im ...

2019-12-15 14:22:35 3099 18

原创 大数据技术原理与应用之【HBase】习题

1.试述在Hadoop体系架构中HBase与其他组成部分的相互关系 答: HBase利用Hadoop MapReduce来处理HBase中的海量数据,实现高性能计算;利用Zookeeper作为协同服务,实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储,利用廉价集群提供海量数据存储能力; S...

2019-12-14 22:35:39 5097 0

原创 HBase底层原理(多维度分析)

        本篇博客,小菌为大家带来的是关于HBase底层原理的讲解!         先上HBase的系统架构图  &nb...

2019-12-13 20:56:34 4409 0

原创 HBase的高级shell管理命令

        继上一篇《HBase常用的shell操作》博客之后,本篇小菌将为大家带来的是关于HBase的高级shell管理命令。        ...

2019-12-12 19:55:52 3775 13

原创 HBase常用的shell操作(清楚详细,小白福利!)

        本篇博客,小菌为大家带来的是HBase常用的shell操作。关于HBase的入门介绍《HBase入门介绍(从基础到架构)》与集群环境搭建《HBase的集群环境搭建》,需要的小伙伴们可自行食用! 1.进入...

2019-12-12 11:21:51 3894 5

转载 Python新手到熟练的百天之路

给大家推荐一个Python资源。 有位名叫骆昊 (jackfrued) 的资深程序员,为...

2019-12-12 10:15:10 4218 20

原创 HBase入门介绍(从基础到架构)

        本篇博客,小菌为大家带来的是关于HBase的入门介绍!              ...

2019-12-12 08:41:53 3810 0

转载 想要学好大数据需掌握这十二大技术!

        大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、...

2019-12-11 23:02:55 3463 0

原创 如何提高CSDN博客的访问量

        开设CSDN博客也有几天时间了,博客的访问量已逐步逼近7000。虽然不是很多,但小菌已经非常满足了,毕竟在CSDN上开源分享,总结经验才是最重要的,访问量,点赞数,评论数等附加数据则是用来评判博客内容质...

2019-12-11 23:02:06 6212 3

原创 Hue集成Hbase

        本篇博客,小菌为大家带来的是Hue集成Hbase的分享。          1.修改hbase配置 在hbase-site...

2019-12-11 21:20:53 3960 0

原创 HBase的集群环境搭建

        本篇博客,小菌为大家带来的是关于HBase的集群环境搭建。         在开始之前,有一个注意事项:HBase强依赖z...

2019-12-11 17:29:35 3787 0

提示
确定要删除当前文章?
取消 删除