- 博客(18)
- 资源 (7)
- 收藏
- 关注

原创 还不会使用大数据ETL工具Kettle,你就真的out了!
> **写在前面:** 博主是一名大数据初学者,昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白,`写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新`。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!个人小站:[http://alices.ibilibili.xyz/](http://alices.ibilibili.xyz/) , 博客主页:[https://alice.blog.csdn.net/](https
2020-04-28 23:53:21
11482
40

原创 大数据岗位必知必会的53个Java基础
文章目录1. java中==和equals和hashCode的区别2. int与integer的区别3. String、StringBuffer、StringBuilder区别4. 什么是内部类?内部类的作用5. 进程和线程的区别6. final,finally,finalize的区别7. Serializable 和Parcelable 的区别8. 静态属性和静态方法是否可以被继承?是否可以被重写?以及原因?9. 成员内部类、静态内部类、局部内部类和匿名内部类的理解,以及项目中的应用10. string.
2020-04-26 21:56:23
11418
49
原创 一招教你用Kettle整合大数据和Hive,HBase的环境!
上一篇博客《还不会使用大数据ETL工具Kettle,你就真的out了!》博主已经为大家介绍了Kettle简单的使用操作,也确实谈到了后面会出较复杂操作的教程,其中当数与大数据组件之前的一些操作。所以本篇博客,博主为大家带来Kettle集成配置大数据的教程,为下一篇Kettle的进阶操作做铺垫!文章目录Kettle集成大数据1. 修改配置文件2. 移动jar包路径3.上传集群核心配置文件到本地并替换4.测试1.
2020-04-29 15:27:40
10019
18
原创 面试一家公司之前需要做的准备
写在前面:因为博主已经参加了工作,故开设了面试专栏,分享一些整理的面试技巧和一些对应专业的面试题。希望大家在浏览的过程中,都能有所收获。另外,由于尚未真正接触到工作岗位,故在一些见识方面有所欠缺的地方,烦请大佬们指正,不胜感激…第一: 1. 了解应聘公司 2. 了解应聘岗位查该公司的资料,知道该公司是做什么的.
2020-04-26 20:04:04
9174
16
原创 Spark综合性练习(Spark,Kafka,Spark Streaming,MySQL)
> **写在前面:** 博主是一名大数据的初学者,昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白,`写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新`。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!个人小站:[http://alices.ibilibili.xyz/](http://alices.ibilibili.xyz/) , 博客主页:[https://alice.blog.csdn.net/](http
2020-04-26 10:00:51
9174
23
原创 小白亲绘思维导图,带你重游Spark生态圈!
肝了有两周,终于把Spark的内容学的差不多了,为了高度总结所学内容的理论精髓,老粉丝肯定都清楚,博主肯定又要做思维导图总结经验了。哈哈,谁让身为蒟蒻的我已经推出了几张导图分享到CSDN上了呢!良心推荐:《史上最良心的scala的思维导图,图文并茂,入坑首选!》《全网最不靠谱的大数据思维导图,带你提前了解Hadoop生态系统,解锁新手福利!!!》建议收藏:《全网最全Python学习路线图+14张思维导图
2020-04-23 18:30:03
9587
32
原创 震惊!StructuredStreaming整合Kafka和MySQL原来这么简单?
上一篇博客博主已经为大家从发展史到基本实战为大家详细介绍了StructedStreaming(具体请见:《看了这篇博客,你还敢说不会Structured Streaming?》)。本篇博客,博主将紧随前沿,为大家带来关于StructuredStreaming整合Kafka和MySQL的教程。 码字不易,先赞后看,养成习
2020-04-22 10:47:00
9214
27
原创 一文告诉你SparkStreaming如何整合Kafka!
关于SparkStreaming从理论到实战的部分,博主已经在前面的博客中介绍了。本篇博客,为大家带来的是SparkStreaming整合Kafka的教程!文章目录Kafka回顾整合kafka两种模式说明1.Receiver接收方式:2.Direct直连方式spark-streaming-kafka-0-8(了解)1.Receiver2.Directspark-streaming-kafka-0-10结语
2020-04-19 19:33:30
9746
31
原创 十年磨一剑,SparkSQL来一题!
之前推出过一期关于Spark的练习,反响还不错。而最近博主又写了关于SparkSQL,SparkStreaming,Structured Streaming的内容,为了巩固大家的基础,提升实战的能力,故备下了一道综合性比较全面的题,希望大家能够受用。文章目录准备数据student.txtcourse.txtscore.txtteacher.txt上题1.查询Student表中“95031”班或性别为“女”的同
2020-04-19 11:13:58
9385
28
原创 春城无处不飞花,小白带你侃SparkStreaming(实战应用篇)
自上一篇《春城无处不飞花,小白带你侃SparkStreaming(原理引入篇)》结束之后,博主就一直在酝酿着下一篇怎么开始,这不,忙了几天终于也有了下文。 码字不易,先赞后看,养成习惯!文章目录第三章 Spark Streaming实战3.1 WordCount3.1.1. 需求&准备3.1.2 代码演
2020-04-19 09:07:18
8629
24
原创 看了这篇博客,你还敢说不会Structured Streaming?
写在前面: 博主是一名软件工程系大数据应用开发专业大二的学生,昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白,写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!个人小站:http://alices.ibilibili.xyz/ , 博客主页:https:...
2020-04-17 09:36:04
9549
29
原创 春城无处不飞花,小白带你侃SparkStreaming(原理引入篇)
介绍完了SparkSQL,接下来让我们推开SparkStreaming的大门,接收新知识的洗礼。跟刚入坑SparkSQL时一样,让我们来回顾一下Spark的内置模块。 相信勤奋好学的大家肯定都还记得的对吧,那么接下来我们就要正式开始学习SparkStreaming咯~
2020-04-13 09:59:30
7776
16
原创 秋名山老司机从上车到翻车的悲痛经历,带你深刻了解什么是Spark on Hive!
本篇博客,博主为大家分享的内容是如何实现Spark on Hive,即让Hive只作为存储角色,Spark负责sql解析优化,执行…话不多说,直接上车! 文章目录上车前需知Spark on hive 与 hive on spark 的区别1. Spark on hive2.hive on spark上车概述发车一、
2020-04-12 19:52:56
7122
26
原创 关于SparkSQL的开窗函数,你应该知道这些!
文章目录1.概述介绍聚合函数和开窗函数开窗函数分类2. 准备工作3. 聚合开窗函数4. 排序开窗函数4.1 ROW_NUMBER顺序排序4.2 RANK跳跃排序4.3 DENSE_RANK连续排序4.4 NTILE分组排名[了解]结语1.概述介绍 相信用过MySQL的朋友都知道,MySQL中也有开窗函数的存在。开窗函数的引入是为了既显示聚集前的数据,又显示聚集后的数据。即在每一行的最后一列添加聚合函
2020-04-12 12:49:08
6614
22
原创 SparkSQL如何实现多数据源交互?这篇博客或许能告诉你答案!
学了一段时间的SparkSQL,相信大家都已经知道了SparkSQL是一个相当强大的存在,它在一个项目的架构中扮演着离线数据处理的"角色",相较于前面学过的HQL,SparkSQL能明显提高数据的处理效率。正因为如此,SparkSQL就会涉及到与多种的数据源进行一个交互的过程。那到底是如何交互的呢,下文或许能给你带来答案… &nb
2020-04-12 10:20:34
6893
18
原创 适合小白入门的IDEA开发SparkSQL详细教程
之前博主利用业余时间,梳理了一份《SparkSQL编程系列》,奈何当时考虑不周,写的不是很详细。于是在正式开始学习了之后,决定整理一篇适合像我一样的小白级别都能看得懂的IDEA操作SparkSQL教程,于是就有了下文… ...
2020-04-11 21:11:14
7631
26
原创 史上最良心的scala的思维导图,图文并茂,入坑首选!
前段时间学习了scala,为了能更好地梳理知识的脉络,掌握到核心的精髓,博主花了几天时间整理了这份关于scala的思维导图,分为三部分在这里展示给大家。 整理不易,先赞后看,养成习惯!scala01sc...
2020-04-05 12:57:36
9191
53
原创 Ta来了,Ta来了,Spark基础能力测试题Ta来了!
因为这段时间在学习Spark,所以本篇博客为大家带来关于Spark的综合性练习一道。 码字不易,先赞后看,养成习惯! 首先让我们准备好该题所需的数据 test.txt &nb
2020-04-05 09:37:23
8792
26
大数据面试宝典-精简版.pdf
2020-04-06
SpringBoot+SpringCloud面试题.doc
2020-06-07
数据可视化驾驶舱.rar
2020-04-29
Java面试 58题.docx
2020-06-07
互联网常见人事面试题.doc
2020-06-07
MQ-A级面试题.pdf
2020-06-07
HBuilder的安装
2019-02-02
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝