Spark相关软件下载地址

教程发布:2021-03-20 浏览学习: 1,170 次 教程分类:资源下载

Spark是一个快速的、通用的、处理大规模数据的计算引擎,2009年诞生于美国加州大学伯克利分校,在2010年成为Apache的开源项目之一。Spark是基于Scala语言编写的,支持Scala、Java、R、Python等语言,并提供了上百种高性能的算法,提供了SQL接口、流式计算、图算法、机器学习等完整而强大的技术栈。Flink是一个面向分布式数据流处理…

HBase相关软件下载地址

教程发布:2021-03-20 浏览学习: 1,306 次 教程分类:资源下载

HBase 是一个分布式的、面向列的、能存储并处理海量数据存储的非关系型开源NoSQL数据库,物理结构存储结构(K-V)。HBase是Apache的Hadoop项目的子项目,运行于 HDFS 文件系统之上,为 Hadoop 提供类似于 BigTable 规模的服务,可在廉价PC Server上搭建大规模结构化存储集群。HBase强读写一致,但是不是“最终一致…

Hadoop相关软件下载地址

教程发布:2021-03-20 浏览学习: 1,378 次 教程分类:资源下载

Hadoop利用分布式环境下软硬件资源,实现Hadoop集群的海量数据的处理能力、存储能力、计算能力,Hadoop平台架构中三大核心组件:HDFS(分布式文件存储,集群)Yarn(分布式资源管理,集群)MapReduce(分布式计算处理,一个应用程序开发包)HDFS(分布式文件存储)一个分布式集群文件系统,可以由很多台廉价的服务器组成集成,通过目录树的方式来…

ClickHouse软件下载

教程发布:2020-12-16 浏览学习: 1,506 次 教程分类:资源下载

ClickHouse是2016年俄罗斯Yandex公司开源出来的一款MPP架构(大规模并行处理)的列式数据库,主要用于大数据分析(OLAP)领域,具有快速查询、线性可扩展、功能丰富、硬件利用效率高、容错、高度可靠等优点。 ClickHouse主要应用场景: 电信行业用于存储数据和统计数据使用 用户行为数据记录与分析 信息安全日志分析 商业智能与广告网络价值数…

PDI-Kettle相关软件下载

教程发布:2020-11-23 浏览学习: 1,808 次 教程分类:资源下载

ETL是Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、清洗转换(transform)、加载(load)至目的端的过程;目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL这个概念经常作为数据仓库技术来使用,但其对象并不限于数据仓库,ETL是BI(商业智能)项目重要的…

TiDB分布式数据库相关软件下载

教程发布:2020-10-27 浏览学习: 1,558 次 教程分类:资源下载

TiDB 是 PingCAP 公司自主设计、研发的国产开源分布式数据库,是一款融合型HTAP分布式数据库产品(同时支持OLTP 在线事务处理、OLAP 在线分析处理),具备水平扩容或者缩容、金融级高可用、实时HTAP、云原生的分布式数据库,兼容 MySQL 5.7 协议和 MySQL 生态等重要特性。 TiDB 适合高可用、强一致要求较高、数据规模较大等各种…

ElasticSearch数据库与ELK相关软件下载

教程发布:2020-10-27 浏览学习: 1,568 次 教程分类:资源下载

ELK”是三个开源项目的首字母缩写,这三个项目分别是:Elasticsearch、Logstash 和 Kibana。Elasticsearch 是一个搜索和分析引擎。Logstash 是服务器端数据处理管道,能够同时从多个来源采集数据,转换数据,然后将数据发送到诸如 Elasticsearch 等“存储库”中。Kibana 则可以让用户在 Elastics…

SQLServer数据库相关安装程序下载

教程发布:2020-06-20 浏览学习: 3,082 次 教程分类:资源下载

微软(Microsoft;中文名称:微软公司或美国微软公司)始建于1975年,是一家美国跨国科技公司,也是世界PC(Personal Computer,个人计算机)软件开发的先导,由比尔·盖茨与保罗·艾伦创办于1975年,公司总部设立在华盛顿州。 微软最为著名和畅销的产品为Windows操作系统和Office系列软件,目前是全球最大的电脑软件提供商,全球软件…