中国人工智能机器学习入职培训领跑者
北大校友创投

18311023120
产品中心
联系我们

电话:010-69946594

传真:010-69946594

邮箱:18311023120@126.com

地址:北京市海淀区中关村创业大街昊海楼7层

产品中心
当前位置:首页 > 供应产品 > 大数据开发 > spark

spark

发布时间:2017-10-30  来源:北京青星教育科技股份公司

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。


Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。


Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。


尽管创建 Spark 是为了支持分布式数据集上的迭代作业,但是实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。通过名为 Mesos 的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。
上一条:大数据
下一条:scala
相关标签:
相关新闻 更多
  •  面对步步逼近的人工智能,你有三个选择:   1、要么积累财富,成为资本大鳄   2、积累名气,成为独特个体   3、积累知识,成为更高深技术的掌握者

  • 青星教育是在教育部、工信部相关领导的关怀下,依托北京大学计算机科学技术系,由知名天使投资、著名教育界人士、资深互联网技术大咖共同投资创建,于2016年10月在中关村创业大街成立的股份制公司,注册资本500万元。同年入驻北京大学校友创业训练营。

  • 说说我自己吧。   高考不理想,调剂到一个我猜多数人都没听说过的专业----植物保护。确实,听名字也挺不好就业的。加上对这个专业实在是没兴趣,大一下学期通过转专业考试转了系。当时只是盲目的想逃离原专业.

相关产品 更多
校区地址:北京市海淀区中关村创业大街昊海楼7层
网址: www.qxdx.org
课程培训电话:18311023120
服务邮箱 18311023120@126.com