6892317 apache 1605059459
42
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题
Java
23小时前
6892317 apache 1605059459
39
Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案
Java
1个月前
38
COOPER 平台通过分析软件开发者大数据对开发者进行全方位画像和协作关系分析,并构建软件开发者知识图谱,在此基础上提供开发者和开发资源的智能搜索与推荐服务
Java
4年前
6892317 apache 1605059459
35
Druid 是一个高性能实时分析数据库。它是为大型数据集上实时探索查询的引擎,提供专为 OLAP 设计的开源分析数据存储系统
Java
接近4年前
963383 idela hp 1578936904
29
该地址更新缓慢,可以移步https://gitee.com/mirrors/Sylph
Java
2年多前
12 mirrors 1578989292
24
HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。
Java
4年前
12 mirrors 1578989292
23
Alluxio(之前名为Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统
Java
1年前
319685 bboss 1578989326
17
this is a db-hdfs tools used to transfer big database datas to hadoop hdfs like sqoop,but bboss bigdata tool is very nice monitor and event drivered model,and high perfermance,support Distributed executor tasks Ability.
Java
5个月前
6892317 apache 1605059459
16
Apache BookKeeper 是一个可以方便扩展,高可用,低延迟的存储系统
Java
6天前
12 mirrors 1578989292
14
Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息
Java
4年前
1723143 tomfat 1578958543
14
这是一个基于机器学习和大数据的决策对抗系统,包含GIS系统,后端基于springMVC,spring,Mybatis,日志基于logback,算法部分包括机器学习,深度学习对打击做仿真
Java
6年多前
12 mirrors 1578989292
13
Hibench 是一个大数据基准测试套件,用来测试框架的速度、吞吐率与资源利用率等
Java
4年前
12 mirrors 1578989292
13
AthenaX 是 Uber 的内部流分析平台,旨在满足以下需求并为每一个人提供可访问的流分析能力: (1)轻松为各类用户提供导航服务,而无需对其技术背景提出任何要求 ; (2)以
Java
4年前
319685 bboss 1578989326
13
kafka-elasticsearch数据同步工具
Java
22天前
6892317 apache 1605059459
11
Apache Fluo 是  Google Percolator(搜索索引)的开源实现,允许用户对存储在 Apache Accumulo 中的大型数据集进行增量更新,而无需重新处理
Java
2个月前

搜索帮助