到底大数据学习都需要学习什么?
1)学习一门计算机的编程语言:建议先学习Java或Scala。
2)学习计算处理框架:严格来说,这分为离线批处理和流式处理,建议学习Flink、Spark Streaming或Kafka Streams中的一个。
3)分布式存储框架:建议学习HDFS。
4)资源调度框架:建议学习YARN。
5)分布式协调框架:建议学习Zookeeper——太多大数据框架都需要它了,比如Kafka,Storm,Hbase等。
6)KV数据库:典型的就是memcache和Redis了,特别是Redis简直是发展神速,建议学习Redis,如果C语言功底好的,较好熟读源码,反正源码也不多。
7)列式存储数据库:建议学习Hbase,这是目前应用较广泛的开源列式存储。
8)消息队列:大数据工程处理中消息队列作为“削峰填谷”的主力系统是必不可少的,当前该领域内的解决方案有很多,包括ActiveMQ,Kafka等。建议学习Kafka,不仅仅好找工作,还能触类旁通进一步理解基于备份日志方式的数据处理模型。
微信扫码关注公众号
获取更多考试热门资料