Spark 1.2.1稳定版本发布(released)

jopen 9年前

Spark 1.2.1是一个维护版本( maintenance release) ,其中修复了一些bug,是基于branch-1.2 分支。并且推荐所有的1.2.0的用户升级到这个稳定版本。此次更新有69位开发者参与。详细的修复bug信息如下:

1、安全模块(Security)
给临时文件的权限加了锁机制。

2、Spark Core
Netty的shuffle忽略了spark.blockManager.port配置 (SPARK-4837);
MetricsServlet没有合理的初始化 (SPARK-4595);
Repl and YARN dependencies are not published to Maven (SPARK-5289);
SparkConf 不是线程安全的(SPARK-5355);
和Spark进行链接时出现的字节码错误 (SPARK-2075)

3、SQL
在Hive UDFs中使用CACHE TABLE AS SELECT失败 (SPARK-5187);
当对projection 使用select查询时,属性是大小写敏感的(SPARK-4959);
使用当前的metadata queries用Hive 13编译Spark SQL失败(SPARK-4908);
当在group by语句和select已经同时使用相同的表达式将会抛出Expression not in GROUP BY (SPARK-4296)

4、Streaming
Proper file clean up for write ahead logs (SPARK-5147)
Error with existing files during checkpoint recovery (SPARK-4835)
Socket Receiver does not stop when streaming context is stopped (SPARK-2892)

5、PySpark
Parallelizing lists or arrays is slow (SPARK-5224)
Serializer bug when using zip (SPARK-4841)
Support Vector types within a dictionary (SPARK-5223)

来自:http://www.iteblog.com/archives/1266