跳过本内容页

请提供下面的信息以登录进入您的 账户,必须填写的信息已经被 加粗和用 (*)标出

必填信息

账户参数

  1. 忘记密码?
没有帐号?点击注册
手机注册 邮箱注册

必填信息

  1. 只能使用字母、数字和符号,将会在您参加的任何讨论或论坛上显示(之后将无法更改) (以后不能更改)

账户致谢

  1. 服务条款

    诚信准则

已有账号? 点击登录
Spark基础课程(一)
本课程是Spark基础课程,主要介绍了Spark的基础知识与应用。
试学 该课程招生全部经由邀请
  1. 课程开始

    2016/11/01
  2. 学时

    5小时/周,1周
  3. 程度

    基础
  4. 学习人数

    8

关于本课

Apache Spark是以速度,易于使用性,以及分析为目的而开发的开源处理引擎。如果你需要普通的Map Reduce项目无法提供的低延时大规模处理数据的能力,Spark就是一种很好的替代方案。Spark在处理循环算法和交互式数据挖掘时比Map Reduce快100倍。Spark提供高速的内存集群计算并且支持Java,Scala和Python API而易于开发。 Spark在相同的应用程序中紧密地将SQL,流处理和各种复杂的分析整合使用,这样可以处理各种数据处理的需求。Spark可以在Hadoop, Mesos,单机版以及云端运行。它接受驱动数据源例如HDFS,Cassandra,Hbase或者S3。

学习目标

1.能够描述什么是Spark。

2.能够完成对弹性分布数据集(RDD)的基本使用。

3.能够创建Scala,Python或者Java创建Spark应用程序。

4.能够创建基于Spark SQL, MLlib, Spark Streaming和GraphX应用程序。

5.解释Scala和Python的基本概念。

6.能够正确的对Spark进行配置,监控和性能调试。

先修知识要求

需要完成大数据学院的“Hadoop基础”课程

对Apache Hadoop 和 Big Data 有基本的了解

基本的Linux操作系统知识

Scala, Python, 或者 Java 编程语言的基本知识

课程讲师

Course Staff Image #1

Henry L. Quach

资深软件工程师,已经在IBM工作7年.他曾经工作于信息管理系统的教育多年,并参与开发过多个大型项目,包括内部教育跟踪评估系统,被广泛应用于很多企业。同时,他也是全球在线教育社区最早的开拓者。他是全球移动创新社区主要的成员,并主讲和开发了多门移动信息教育课程。Henry拥有加州圣何塞州立大学计算机科学本科和硕士文凭。

课程目录

Spark 基础课程(一)
  1. Lesson 1 Spark简介
  2. Lab 1
  3. Lesson 2 弹性分布数据集(RDD)
  4. Lab 2
  5. Lesson 3 Spark应用程序的基本编程
  6. Lab 3
  7. Lesson 4 Spark库介绍
  8. Lab 4
  9. Lesson 5 Spark的配置、监控和优化
  10. Lab 5
提示
?

学习这门课程,你必须同意自动注册数据大学(BIGDataUniversity.com.cn)。

将为您创建登录邮箱为,密码为的账号
(注:如果在数据大学已经注册该邮箱,请使用原密码登录)