开源项目,开源代码,开源文档,开源新闻,开源社区

1 目前的主流大数据处理技术都是以Map Reduce计算模式为核心的（包括Hadoop和Spark）。而 Map Reduce 计算模式下对第一个问题只能通过增加内存，SSD存储来解决或者缓解，

tianyuak47 2016-12-14 16216 0

数据挖掘算法开源机器学习

Pig中的Streaming主要分为4个组件: 1. Pig Latin 2. 逻辑层(Logical Layer) 3. 物理层(Physical Layer) 4. Streaming具体实现(I

jopen 2014-12-04 22140 0

分布式/云计算/大数据 Apache Pig

学习平台，以推动人工智能技术的快速普及，把在搜索、图像识别、语音识别、自然语言处理、用户画像及情感分析等人工智能领域的优势整合升级，为程序开发者提供了一个功能更全、效果更好的深度学习框架。其实，

icanb55sq 2016-10-24 15665 0

深度学习软件架构

大会）已经于旧金山闭幕，超过 1 万名参与者参加了本次大会，包括谷歌的客户、合作方、开发人员、IT 领袖、工程师、媒体、分析家、云端爱好者（也包括持怀疑态度的朋友）等。在这 3 天时间里，超过 200 位分享者进行了主题演讲，另外还有

jopen 2017-03-15 37414 0

Google

大会）已经于旧金山闭幕，超过 1 万名参与者参加了本次大会，包括谷歌的客户、合作方、开发人员、IT 领袖、工程师、媒体、分析家、云端爱好者（也包括持怀疑态度的朋友）等。在这 3 天时间里，超过 200 位分享者进行了主题演讲，另外还有

jopen 2017-03-15 38844 0

Google

集成YARN。 SQL支持度：支持SQL92中的大部分select语句，以及SQL2003标准中的分析函数。不支持DELETE和UPDATE，但是支持批量装载数据（insert into select

er74 2015-07-26 61584 0

分布式/云计算/大数据 Impala

编程操作Java字节码的函数库。 ASM ：通用底层字节码操作及分析。 Javassist ：尝试简化字节码编辑。 Byte Buddy ：使用“流式API”进一步简化字节码生成。代码分析软件度量和质量评估工具。 Checkstyle

my5g 2015-01-07 84238 0

Java资源 Java开发

字节码的函数库。 ASM ：通用底层字节码操作及分析。 Javassist ：尝试简化字节码编辑。 Byte Buddy ：使用“流式 API”进一步简化字节码生成。代码分析软件度量和质量评估工具。 Checkstyle

jopen 2015-01-09 78536 4

Java资源大全

ASM ：通用底层字节码操作及分析。 Javassist ：尝试简化字节码编辑。 Byte Buddy ：使用“流式API”进一步简化字节码生成。代码分析软件度量和质量评估工具。

jopen 2015-02-27 64194 0

Java Java开发

数据仓库的数据时效性，可以理解为数据从业务系统到达仓库之后可用于分析的时间。小编记得刚毕业那会子给政府做数据仓库，最重要的工作就是往数据库录数据，那时分析用的数据根本谈不上时效性，如果非要加一个期限的话，最起码是一周。。。

gwvs1220 2016-11-02 8695 0

京东数据仓库软件架构

DC/OS使用了哪些技术可以做到这一点呢？如图，左面是普通的Linux操作系统，右面是DC/OS，在这里做了一个对比。无论是哪种操作系统，都需要管理外部的硬件设备，最重要的四种硬件资源即CPU、内存、存储、网络。

Leonel94P 2016-10-16 12405 0

操作系统 Mesos 软件架构

是同步，否则，更像是异步。无论如何，工程师们不能生活在混沌之中，不做决定往往是最坏的决定。当分析一个通讯需求或者进行通讯构架的时候，工程师们被迫作出“同步”还是“异步”的决定。当决策的结论是“异

dcas9886 2016-08-03 20690 0

分布式系统分布式/云计算/大数据

务调用，比如推荐系统，也有的是输出到前台，比如浏览历史。系统实现采用的是Java+Kafka+Storm+Redis+Mysql+Tomcat+Spring的技术栈。 Java ：目前公司内部Ja

guananfang 2017-04-13 31000 0

MySQL Redis 软件架构

成，之前，业务中对实时的要求并不高，最多也就是准实时（延迟半小时以上），因此，我们使用Flume将数据收集到HDFS，然后进行清洗和分析。后来，根据业务需要，我们有了两个Hadoop集群，并且部署在不同的地方（北京和西安），而所

jopen 2015-11-30 50542 0

日志日志处理

Learning Summer School》介绍：每天请一个大牛来讲座，主要涉及机器学习，大数据分析，并行计算以及人脑研究。 https://www.youtube.com/user/smolix （需FQ）

jopen 2016-01-17 112827 0

深度学习

Learning Summer School》介绍：每天请一个大牛来讲座，主要涉及机器学习，大数据分析，并行计算以及人脑研究。 https://www.youtube.com/user/smolix （需FQ）

xg48 2015-04-12 350748 0

机器学习

且可以免费获得。专门的数据系统是为 OLAP , 搜索 , 简单在线存储 , 批处理 , 图像分析 , 等等而存在的。更多的不同类型数据的组合，以及将这些数据存放到更多的系统中的愿望，导致了一个巨大的数据集成问题。

jopen 2014-02-10 98975 0

软件工程师

拟合。虽然每个基分类器很弱，但最后组合的结果通常很强，这也类似于：“三个臭皮匠顶个诸葛亮”的思想。对比发现Random Forest（随机森林）和SVM（支持向量机）名列第一、第二名。 0x0D.jpg

jopen 2016-01-20 22355 0

算法

ta Druid 是一个用于大数据实时查询和分析的高容错、高性能开源分布式系统，旨在快速处理大规模的数据，并能够实现快速查询和分析。尤其是当发生代码部署、机器故障以及其他产品系统遇到宕机

8gw234 2015-04-26 35219 0

Druid 分布式/云计算/大数据

同时还引进更多更专业型的技术人才（模型、算法、分析以及大数据开发等）。目前，整个授信过程实现全自动，人的经验明显落后于海量维度精细化测算的评分结果。分析人员也在不断训练和调校模型的准确性，进行系统快速

tweeto31 2017-02-15 21960 0

京东金融

轻量级大规模机器学习算法库Fregata开源：快速，无需调参经验

面向Hadoop框架的高级语言： Apache Pig 经验

解秘：百度PaddlePaddle深度学习框架和搜索引擎基础架构经验

2017谷歌云大会，一口气发布100+消息资讯

2017谷歌云大会，一口气发布100+消息资讯

impala笔记经验

国外程序员整理的Java资源大全经验

推荐！国外程序员整理的Java资源大全资讯

Java应用程序开发相关工具集合经验

浅析京东实时数据平台：架构篇经验

深入解析DC/OS 1.8——高可靠的微服务及大数据管理平台经验

分布式队列编程模型、实战经验

携程实时用户行为系统实践经验

记录一下互联网日志实时收集和实时计算的简单方案经验

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）资讯

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）经验

每个软件工程师都应该知道的有关实时数据的统一概念经验

0x0D 随机之美，随机森林经验

Druid：一个用于大数据实时处理的开源分布式系统经验

走进京东金融：听过来人谈经验及技术干货经验

Flink，Spark Streaming，Storm对比分析的相关搜索

关键词

轻量级大规模机器学习算法库Fregata开源：快速，无需调参 经验

面向Hadoop框架的高级语言： Apache Pig 经验

解秘：百度PaddlePaddle深度学习框架和搜索引擎基础架构 经验

2017谷歌云大会，一口气发布100+消息 资讯

2017谷歌云大会，一口气发布100+消息 资讯

impala笔记 经验

国外程序员整理的Java资源大全 经验

推荐！国外程序员整理的Java资源大全 资讯

Java应用程序开发相关工具集合 经验

浅析京东实时数据平台：架构篇 经验

深入解析DC/OS 1.8——高可靠的微服务及大数据管理平台 经验

分布式队列编程模型、实战 经验

携程实时用户行为系统实践 经验

记录一下互联网日志实时收集和实时计算的简单方案 经验

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等） 资讯

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等） 经验

每个软件工程师都应该知道的有关实时数据的统一概念 经验

0x0D 随机之美，随机森林 经验

Druid：一个用于大数据实时处理的开源分布式系统 经验

走进京东金融：听过来人谈经验及技术干货 经验

Flink，Spark Streaming，Storm对比分析 的相关搜索

关键词

轻量级大规模机器学习算法库Fregata开源：快速，无需调参经验

解秘：百度PaddlePaddle深度学习框架和搜索引擎基础架构经验

2017谷歌云大会，一口气发布100+消息资讯

2017谷歌云大会，一口气发布100+消息资讯

impala笔记经验

国外程序员整理的Java资源大全经验

推荐！国外程序员整理的Java资源大全资讯

Java应用程序开发相关工具集合经验

浅析京东实时数据平台：架构篇经验

深入解析DC/OS 1.8——高可靠的微服务及大数据管理平台经验

分布式队列编程模型、实战经验

携程实时用户行为系统实践经验

记录一下互联网日志实时收集和实时计算的简单方案经验

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）资讯

近200篇机器学习&深度学习资料分享（含各种文档，视频，源码等）经验

每个软件工程师都应该知道的有关实时数据的统一概念经验

0x0D 随机之美，随机森林经验

Druid：一个用于大数据实时处理的开源分布式系统经验

走进京东金融：听过来人谈经验及技术干货经验

Flink，Spark Streaming，Storm对比分析的相关搜索