云计算学习科目主要是:
操作系统:Linux
计算机网络:TCP/IP
数据库:oracle、mysql
数据结构与算法、分析与设计的能力、分布式、虚拟化等
Linux基础和分布式集群技术:熟练使用Linux,熟练安装Linux上的软件,了解熟悉负载均衡、高可靠等集群相关概念,搭建互联网高并发、高可靠的服务架构;学完此阶段可解决的现实问题:搭建负载均衡、高可靠的服务器集群,可以增大网站的并发访问量,保证服务不间断地对外服务;学完此阶段可拥有的市场价值:具备初级程序员必要具备的Linux服务器运维能力。
大数据学习科目主要是:Java、Linux基础、Shell编程、Hadoop2.x、HDFS、YARN、MapReduce、ETL数据清洗Hive、Sqoop、Flume/Oozie、大数据WEB工具Hue、HBase、Storm、Scala、KafkaSpark、Spark核心源码剖析、CM、5.3.x管理、CDH、5.3.x集群等。下面简单介绍几项编程语言:
javaMR语言这种语言产生很早了,大家也或多或少的接触过,但是在大数据中使用已经有的原型进行构建庞大系统,是一种基本的选择。
Scala语言以java为基础的语言,和java很像,对任何想要进行大规模的机械学习或是建立高阶的算法,Scala是逐渐兴起的工具,善于呈现且拥有建立可靠系统的能力。
Hadoop在以java为基础的大数据处理当中,Hadoop为作一批数据处理,发展以java为基础的架构关键。相对于其他处理工具而言,Hadoop慢许多,但是无比的准确可被后端数据库分析广泛使用。
Kafka、andStorm它是一个特别快速的查询信息系统,但是因为太快了在实施操作时会犯错,有时候会漏掉东西。
Pythom语言Python拥有R语言处理复杂数据的能力及更务实的语言特质,更简单和直观,在近几年的成长很快。在数据处理范畴内,通常在规模与复杂之间要有个选择,Python无疑当选。