English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Agregación MongoDB

Las operaciones de agregación procesan registros de datos y devuelven resultados de cálculo. Las operaciones de agregación agrupan valores de múltiples documentos y pueden realizar varias operaciones en los datos agrupados para devolver un solo resultado. En SQL, count(*)y group by equivalente a la agregación de MongoDB.

Método Aggregate()

Para las operaciones de agregación en MongoDB, debe usar aggregate() Método.

Sintaxis

aggregate()La sintaxis básica del método es la siguiente-

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

Ejemplo en línea

En la colección, tiene los siguientes datos-

{
   _id: 'ObjectId('7df78ad8902c)
   title: 'MongoDB Overview' 
   description: 'MongoDB不是SQL数据库'
   by_user: 'oldtoolbag.com',
   url: 'https://es.oldtoolbag.com',
   tags: ['mongodb', 'database', 'NoSQL'],
   likes: 100
},
{
   _id: 'ObjectId('7df78ad8902d)
   title: 'NoSQL Overview' 
   description: 'No SQL数据库是非常快的'
   by_user: 'oldtoolbag.com',
   url: 'https://es.oldtoolbag.com',
   tags: ['mongodb', 'database', 'NoSQL'],
   likes: 10
},
{
   _id: 'ObjectId('7df78ad8902e)
   title: 'Neo4j Resumen', 
   description: 'Neo4j es una base de datos No SQL
   by_user: 'Neo4j',
   url: 'http://www.neo4j.com',
   tags: ['neo4j', "database", "NoSQL"],
   likes: 750
},

Ahora, si se desea mostrar una lista desde la colección anterior, indicando cuántos tutoriales ha escrito cada usuario, se utilizará lo siguienteaggregate()Método-

>  db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
{ "_id": "oldtoolbag.com", "num_tutorial": 2 }
{ "_id": "Neo4j", "num_tutorial": 1 }
>

La consulta equivalente de SQL para los casos anteriores será select by_user, count(*) from mycol group by by_user.

En el ejemplo anterior, ya hemos ordenado por el campoby_userSe ha agrupado el documento y en cada agrupación por usuario, el valor anterior de sum se aumenta. A continuación se muestra una lista de expresiones de agregación disponibles.

ExpresiónDescripciónEjemplo
$sumCalcular la suma total.db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avgCalcular el valor promediodb.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$minObtener el valor mínimo correspondiente a todos los documentos en la colección.db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$maxObtener el valor máximo correspondiente a todos los documentos en la colección.db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$pushInsertar un valor en un array en el documento de resultados.db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet在结果文档中插入值到一个数组中,但不创建副本。db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first根据资源文档的排序获取第一个文档数据。db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last根据资源文档的排序获取最后一个文档数据db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

管道的概念

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。

这里我们介绍一下聚合框架中常用的几个操作:

  • $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。

  • $match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。

  • $limit:用来限制MongoDB聚合管道返回的文档数。

  • $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。

  • $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。

  • $group:将集合中的文档分组,可用于统计结果。

  • $sort:将输入文档排序后输出。

  • $geoNear:输出接近某一地理位置的有序文档。

实例 管道操作符

1实例 $project

db.article.aggregate(
    { $project : { }}
        title : 1 ,
        author : 1 ,
    }}
 );

De esta manera, en los resultados solo se incluirán los campos _id, tilte y author, por defecto, el campo _id se incluye. Si no se desea incluir _id, se puede hacer así:

db.article.aggregate(
    { $project : { }}
        _id : 0 ,
        title : 1 ,
        author : 1
    ]]);

2.$match ejemplo

db.articles.aggregate( [
                        { $match : { score : { $gt : 70, $lte : 90 } } },
                        { $group: { _id: null, count: { $sum: 1 }}}
                       ]);

$match se utiliza para obtener registros con una puntuación mayor que70 es menor o igual que90 registros, luego envía los registros que cumplen con los criterios al siguiente operador de tubería $group.

3.$skip ejemplo

db.article.aggregate(
    { $skip : 5 });

Después de la operación de tubería $skip, se "filtran" los primeros cinco documentos.