Spark SQL 初探: 使用大数据分析2000万数据 经验

使用Spark SQL分析数据 去年网上曾放出个2000W的开房记录的数据库, 不知真假。 最近在学习Spark, 所以特意从网上找来数据测试一下, 这是一个绝佳的大数据素材。 如果数据涉及到个人隐私,请尽快删除,

jopen 2014-12-11   177140   0

利用phpexcel对数据数据的导入excel(excel筛选)、导出excel 代码段

ll()->getStartColor()->setARGB('FFFF0000');/ //插入数据 $dsql->Execute('omebrand_list',"select i.goods_id

nepe 2015-04-29   1184   0
PHP  
P5

  百万数据查询优化海量数据查询优化 文档

百万数据查询优化 (以下均为个人网上查询资料总结) 1. 索引 误区: 索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,因为

shockwave 2013-12-15   7824   0
P14

  OMP 数据库 goldengat e数据传输方案 文档

OMP数据库goldengate数据传输方案 第一部分:环境描述与设备准备 一、 OMP数据goldengate部署 1、goldengate部署图 2、整体技术部署实施要点 A、在生产数据库的RA

chensir8 2012-04-19   3536   0
方案  
P6

  大数据下的数据分析平台架构 文档

大数据下的数据分析平台架构 随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。

shuixian0626 2012-07-06   4913   0
P20

  db2数据库安装、数据库创建步骤 文档

DB2数据库安装步骤 1 点击安装文件,出现如下界面 2 点击“安装产品”,进入如下界面 3 点击下一步,进入如下界面 4 接受许可协议的全部条款。点击下一步,进入如下界面 5选择安装类型,这里选择“定制安装”,进入如下界面

匹马戍梁州 2016-05-09   1210   0

100 亿数据 1 万属性数据架构设计 经验

本篇将讲述一下 58 同城最核心的数据“帖子”的架构实现技术细节,说明不仅不是“不可能这么用”,而是大数据,可变属性,高吞吐场景下的“常用手段”。 一、背景描述及业务介绍 问:什么是数据库扩展的 version

DerNaquin 2017-01-19   11236   0

菜鸟也能玩转大数据:Airbnb开源Presto数据库SQL工具 资讯

,使普通员工也能够用Hadoop系统分析大数据。 Airpal是Airbnb一年前就已经开发并使用的Presto数据查询工具,通过Airpal的设计宗旨是降低数据查询门槛,通过可视化界面等使不同部门的业务人员也能轻松写出数据查询请求,预览、分享并复用查询任务。

jopen 2015-03-10   19193   0
Airbnb  

指点迷津的现代数据数据架构之道 资讯

本文评析了现代数据架构所需要的几个部分。 鉴于许多企业组织在竭力采用易于使用的数据分析技术让大数据广泛可用,它们应考虑将部分功能外包到云端。如果选择一种大数据即服务解决方案,可以处理像Hado

jopen 2016-03-09   4973   0

为个人提供数据挖掘服务的开源应用ThinkUp:让数据有你的故事 资讯

ThinkUp 是个消费级别的数据挖掘应用,它为普通的个人提供科技和市场营销公司常做的数据解析服务。只不过 ThinkUp 在理念上更尊重用户的利益,更注重通过社交网络数据的解读让用户进一步的发现自己。打通

jopen 2013-10-16   8782   0
ThinkUp  
P4

  Flex数据类型和Java数据类型对应关系 文档

 FLEX数据类型和JAVA数据类型对应关系 类型名   类型描述   Boolean   只有两个值:true 和false   Int   整数类型,取值范围:-2147483648~2147483647

kklion 2011-11-16   2236   0
P2

  Java数据类型和MySql数据类型对应表 文档

Java数据类型和MySql数据类型对应表 java mysql 数据类型对照 类型名称 显示长度 数据库类型 JAVA类型 JDBC类型索引(int) 描述 VARCHAR L+N VARCHAR

jilijelon 2014-06-29   447   0
P21

  途牛多数据中心分布式数据库同步 文档

(本页无文本内容) 2. 多机房分布式数据库同步谭俊青@途牛 mysqlab.net 3. 背景 南、北数据同步存在延时 南、北专线可能会意外中断 南、北业务都不能中断 本地读取数据一致性不能得到保证 灾备需要

byc2 2014-11-19   2879   0
P29

  oracle数据库性能优化实务第10讲数据文件io 文档

1. Oracle数据库性能优化实务 第9讲:数据文件IO主讲人:白鳝华章培训网、[www.hztraining.com]华章培训网版权所有 2. Oracle数据文件IO相关的因素存储系统 OS的相关配置

adt126 2014-01-16   495   0

SQL server数据库的数据恢复(来自实际案例和网上知识) 博客

SQL server 数据库的数据恢复(来自实际案例和网上知识) 1)Full Backup(全备份) 将用户设定的整个目录或文件全部备份。 2)Differential Incremental

honghu79 2012-05-09   3244   0

2015大数据峰会让你深度理解大数据的奥秘 问答

2015大数据峰会 2015大数据峰会汇聚不同的专业和背景的专家,教授,企业家。从而让我们聆听不同的声音。演讲包含企业和学术探讨。我们可以看到大数据在企业中的应用和切实的产品。从学术的角度可以领悟到将来的发展。

活动家becky 2015-08-25   11444   0

Postgresql数据库查询数据,可以忽略大小写吗? 问答

我记得mysql是忽略大小写,大小写无关的

gisos 2019-02-19   39765   0
P19

  海量数据处理分析 文档

1. 海量数据处理分析 (作者 北京迈思奇科技有限公司 戴子良) 原文地址: http://blog.csdn.net/DaiZiLiang/archive/2006/12/06/1432193.aspx

chenzenan 2013-04-10   2496   0
P20

  JBPM数据库表说明 文档

JBPM数据库表说明 1 流程配置类数据库表: 1.1 JBPM_PROCESSDEFINITION:流程模版表 字段名 字段含义 主键 外键 ID_ 流程模版标识 √ × NAME_ 流程模版名称

yong7022002 2010-09-04   5563   0
P42

  Java 数据结构和算法 文档

Java数据结构和算法 一、数组于简单排序 1 二、栈与队列 3 三、链表 3 四、递归 3 五、哈希表 3 六、高级排序 3 七、二叉树 3 八、红—黑树 3 九、堆 3 十、带权图 3 一、数组于简单排序

bruce0314 2014-08-05   366   0
1 2 3 4 5 6 7 8 9 10