Skip to content

Latest commit

 

History

History
273 lines (213 loc) · 28.2 KB

README.md

File metadata and controls

273 lines (213 loc) · 28.2 KB

👋 专注大数据技术,如果您是一名大数据技术的初学者,那么这份资料可以很快的帮助你入门,让您少走弯路,如果您已经有大数据开发基础,或许这份资料可以让您对大数据领域的各个框架原理有更深入的理解,不管您是用来学习,还是用来面试,都会对您有很大的收获!注:本资料是本人在秋招前备战大厂面试学习过程中总结的资料,里面有本人写的资料,也有参考别人写得好的文章,如果文中有不足之处,还请欢迎指出!

计算机基础

计算机网络

  1. 计算机网络(一)
  2. 计算机网络(二)
  3. 计算机网络三
  4. 计算机网络四

操作系统

  1. 操作系统一
  2. 操作系统二
  3. 内存管理
  4. IO
  5. 死锁
  6. 进程和线程
  7. linux
  8. 进程间通信的几种方式的介绍及比较

JAVA

基础

  1. Java基础知识
  2. Java基础知识疑难点
  3. Java常见关键字总结
  4. IO模型
  5. 排序
  6. 接口和抽象类的区别
  7. jAVA 8新特性

集合:(重难点👍)

  1. ArrayList源码+扩容机制分析
  2. ArrayList快速失败机制
  3. LinkedList源码分析
  4. HashMap(JDK1.8)源码+底层数据结构分析
  5. HashMap面试题
  6. ConcurrentHashMap源码+底层数据结构分析
  7. LinkedHashMap 源码详细分析(JDK1.8)
  8. 集合面试题一
  9. 集合面试题目二

多线程:(重难点👍)

  1. 程序,进程,线程的理解
  2. Java线程
  3. 共享模型 之管程(悲观锁)
  4. 共享模型之内存
  5. Atomic原子类总结
  6. AQS原理以及AQS同步组件总结
  7. 线程池小结
  8. 多线程基础面试题
  9. 多线程进阶面试
  10. 多线程高频
  11. 多线程进阶

JVM:(重点👍)

  1. 概述—类加载
  2. 运行时数据区
  3. 方法区
  4. 堆区
  5. 垃圾回收概念
  6. 垃圾回收算法概述
  7. 垃圾回收器
  8. String-Table原理
  9. JVM面试题目总结

Mysql

  1. Mysql基础
  2. Mysql建立索引
  3. Mysql基础总结
  4. Mysql高级
  5. Mysql主从复制
  6. sql Top N问题
  7. Mysql三大日志
  8. InnoDB对MVCC的实现
  9. 一条sql语句在mysql中如何执行的
  10. mysql日期函数总结

设计模式

  1. 设计模式的目的
  2. UML类图
  3. 单例设计模式
  4. 建造者设计模式
  5. 享元设计模式
  6. 代理设计模式
    1. 代理详解
  7. 组合设计模式
  8. 装饰器模式
  9. 适配器模式
  10. 简单工厂模式
  11. 外观模式
  12. 原型模式
  13. 桥接设计模式
  14. 项目中的设计模式

大数据系列

Hadoop

  1. Hadoop基础
  2. 分布式文件基础Hdfs
  3. MapReduce计算模型
  4. Yarn资源调度器
  5. MapReduce原理

Hive

  1. Hive笔记
  2. Hive中的窗口函数

HBase

  1. HBase基础

Redis

  1. Redis基础
  2. Redis数据结构
  3. 布隆过滤器
  4. Rides常见问题
  5. 3种常用的缓存读写策略

Zookeeper

  1. zookeeper

Kafka

  1. Kafka基础

Flume

  1. Flume基础

Spark

  1. Spark概述
  2. Spark版WordCount
  3. Spark运行环境
  4. Spark运行架构
  5. Spark核心编程
  6. Spark调优(一)
  7. Spark调优(二)
  8. Spark 的 Yarn-cluster 模式和 Yarn-client 模式
  9. Spark内核原理
  10. Spark是多进程还是多线程编程模型
  11. Spark中的join操作
  12. Spark面试
  13. spark shuffle介绍

Spark Sql

  1. SparkSql概述
  2. Spark Sql架构
  3. DataSet
  4. DataFrame
  5. SparkSql实战
  6. SparkSql扩展
  7. SparkSql整合Hive和Jdbc
  8. SparkSql数据处理
  9. SparkSql小项目

Flink

  1. Flink介绍
  2. Flink版Window.md
  3. Flink部署
  4. Flink运行架构
  5. Flink流处理API
  6. Flink四大基石
  7. Flink的window机制
  8. Flink时间语义
  9. Flink状态管理
  10. Flink容错机制
  11. ProcessFunction API(底层 API)
  12. Flink高级特性
  13. Flink监控与优化
  14. Flink一致性快照
  15. Flink中Task的划分
  16. Flink学习--Flink on Yarn
  17. Flink内存管理
  18. Flink CEP

基于Flink的实时数仓项目

  1. 项目说明
  2. 数据格式说明
  3. 实时数仓_数据采集层_ODS
  4. 实时数仓_DWD层数据
  5. 数仓 DWM 层业务实现
  6. 实时数仓DWS 层业务实现
  7. 实时项目优化
  8. 实时数仓项目总结

离线数仓

  1. 离线数据仓库及项目需求
  2. 数据生成模块
  3. 数据采集模块
  4. ODS层数据
  5. DWD层数据
  6. DWS及DWT层数据
  7. ADS层数据
  8. 离线数据仓库项目总结
  9. 项目中遇到的问题
  10. 行式存储和列式存储
  11. 离线数仓建模理论

分布式

  1. 分布式基础
  2. 分布式事务
  3. 分布式锁
  4. 分布式ID解决方案
  5. RPC协议
  6. 为什么需要分布式锁?
  7. Redis与MySQL双写一致性如何保证?

数据挖掘

  1. 使用sklearn学习决策树

面经整理

基础部分

  1. Java核心
  2. Java集合
  3. Java集合面试高频
  4. 并发编程
  5. 多线程高频面试
  6. JVM一
  7. JVM二
  8. 数据库
  9. 网络
  10. Leetcode sql面试题目
  11. 牛客网sql练习题目
  12. LRU算法的实现

框架部分

  1. Hadoop篇
  2. Kafka篇
  3. zookeeper
  4. Hive篇
  5. Spark篇
  6. Flink
  7. Rides面试一
  8. Rides面试二
  9. 项目中用到的设计模式
  10. 生产者消费者模型