MongoDB 高级聚合查询

jopen 11年前

MongoDB版本为:2.0.8 

系统为:64Ubuntu 12.04

先给他家看一下我的表结构[Oh sorry, Mongo叫集合]

MongoDB 高级聚合查询

如你所见,我尽量的模拟现实生活中的场景。这是一个人的实体,他有基本的manId manName, 有朋友[myFriends],有喜欢的水果[fruits],而且每种水果都有喜欢的权重。

很不好的是你还看见了有个“_class”字段? 因为我是Java开发者, 我还喜欢用Spring,因此我选用了Spring Data Mongo的类库[也算是框架吧,但是我不这么觉得]

现在有很多人Spring见的腻了也开始烦了。是的,Spring野心很大,他几乎想要垄断Java方面的任何事情。没办法我从使用Spring后就离不开他,以至于其他框架基本上都不用学。我学了Spring的很多,诸如:Spring Security/Spring Integration/Spring Batch等。。。不发明轮子的他已经提供了编程里的很多场景,我利用那些场景解决了工作中的很多问题,也使我的工作变得很高效。从而我又时间学到它更多。Spring Data Mongo封装了mongodb java driver,提供了和SpringJDBC/Template一致编程风格的MongoTemplate

见:http://static.springsource.org/spring-data/data-mongodb/docs/current/api/org/springframework/data/mongodb/core/MongoTemplate.html

不说废话了,我们直接来MongoDB吧。

  • Max 和Min

我和同事在测试Mongo时,索引还写了不到一半,他想查询某个字段的最大值,结果找了半天文档也没找到关于max的函数。我也很纳闷这是常规函数啊怎么不提供? 后来经过翻阅资料确定Mongo确实不提供直接的maxmin函数。但是可以通过间接的方式[sort limit]实现这个。

要查询最大值我们只需要把结果集按照降序排列,取第一个值就是了。

如我的例子,我想取得集合中年龄最大的人。

db.person.find({}).sort({"age" : -1}).limit(1)

相反如果想要年龄最小的人,只需要把sort中改为{“age”1}就可以了。

当然我们使用了sort,对于小数量的文档是没问题的。当对于大量数据需要给age建立索引,否则这个操作很耗时。

  • distinct
MongoDB的destinct命令是获取特定字段中不同值列表的最简单工具。该命令适用于普通字段,数组字段[myFriends]和数组内嵌文档[fruits].

如上面的图片,我认为fruitsmyFriends字段是不同的。网上很多资料和例子都没说到这个情景,因为我们也业务是fruits这样的模型,我测试了。对于fruits.fruitId他也是可行的。

如上面的表结构,我想统计所有的喜欢的水果。

db.person.distinct("fruits.fruitId")

他成功执行了。输出如:

[ "aaa", "bbb", "ccc", "www", "xxx", "yyy", "zzz", "rrr" ]

我想统计集合中共有多少个人[按名字吧]

db.person.distinct("manName")

我想统计指定个数的人的共同关注的朋友。

db.person.distinct("myFriends", {"manName" : {"$in" : ["ZhenQin", "YangYan"]}})

输出如:

[ "234567", "345678", "456789", "987654", "ni", "wo" ]

那么我使用Java呢? 我只是在演示Mongo的命令,用Spring Data Mongo是怎么操作的?

Spring Schema

<beans xmlns="http://www.springframework.org/schema/beans"         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"         xmlns:context="http://www.springframework.org/schema/context"         xmlns:mongo="http://www.springframework.org/schema/data/mongo"         xsi:schemaLocation="http://www.springframework.org/schema/beans            http://www.springframework.org/schema/beans/spring-beans-3.0.xsd            http://www.springframework.org/schema/context            http://www.springframework.org/schema/context/spring-context-3.1.xsd            http://www.springframework.org/schema/data/mongo            http://www.springframework.org/schema/data/mongo/spring-mongo-1.0.xsd">        <context:property-placeholder location="classpath:mongo.properties" />        <!-- Default bean name is 'mongo' -->      <mongo:mongo id="mongo" host="${mongo.host}" port="${mongo.port}" />        <mongo:db-factory id="mongoDbFactory"                    mongo-ref="mongo"                    dbname="mongotest" />        <bean id="mongoTemplate" class="org.springframework.data.mongodb.core.MongoTemplate">          <constructor-arg name="mongoDbFactory" ref="mongoDbFactory"/>      </bean>  </beans>

maxmin的测试

@Test      public void testMaxAndMinAge() throws Exception {          Query q = new BasicQuery("{}").with(new Sort(new Sort.Order(Sort.Direction.ASC, "age"))).limit(1);          Person result = mongoTemplate.findOne(q, Person.class);          log.info(result);            q = new BasicQuery("{}").with(new Sort(new Sort.Order(Sort.Direction.DESC, "age"))).limit(1);          result = mongoTemplate.findOne(q, Person.class);          log.info(result);      }

distinct的测试:

@Test      public void testDistinct() throws Exception {          List result = mongoTemplate.getCollection("person").distinct("myFriends");          for (Object o : result) {              log.info(o);          }            log.info("==================================================================");          Query query = Query.query(Criteria.where("manId").is("123456"));          result = mongoTemplate.getCollection("person").distinct("myFriends", query.getQueryObject());          for (Object o : result) {              log.info(o);          }            log.info("==================================================================");          result = mongoTemplate.getCollection("person").distinct("fruits.fruitId");          for (Object o : result) {              log.info(o);          }      }

输出的结果为:

12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 234567  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 345678  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 456789  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 987654  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] ni  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] wo  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(72)] 123456  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(75)] ==================================================================  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 234567  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 345678  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 456789  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(79)] 987654  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(82)] ==================================================================  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] aaa  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] bbb  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] ccc  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] www  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] xxx  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] yyy  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] zzz  12-22 14:13:45 [INFO] [t.MongoAdvaceQueryTest(85)] rrr  12-22 14:13:45 [INFO] [support.GenericApplicationContext(1020)] Closing org.springframework.context.support.GenericApplicationContext@1e0a91ff: startup date [Sat Dec 22 14:13:44 CST 2012]; root of context hierarchy
这里我要特别说明一下, 当使用了Spring Data Mongo,如上面的findOne(query, Person.class)它就会把查询的结果集转换成Person类的对象。Spring Data Mongo的很多API中都这样,让传入了一个Bean的class对象。因为distinct的测试是输出list<String>的,我使用的mongo-java-driver的api。他们都很简单,唯一的是Query这个Spring提供的对象,希望读者注意,他几乎封装了所有条件查询,sort,limit等信息。query的api见: