Tutoriales básicos de MongoDB

Tutoriales avanzados de MongoDB

Replicación (conjunto de réplicas) MongoDB Índices MongoDB

Agregación MongoDB

Las operaciones de agregación procesan registros de datos y devuelven resultados de cálculo. Las operaciones de agregación agrupan valores de múltiples documentos y pueden realizar varias operaciones en los datos agrupados para devolver un solo resultado. En SQL, count(*）y group by equivalente a la agregación de MongoDB.

Método Aggregate()

Para las operaciones de agregación en MongoDB, debe usar aggregate() Método.

Sintaxis

aggregate()La sintaxis básica del método es la siguiente-

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

Ejemplo en línea

En la colección, tiene los siguientes datos-

{
　　　_id: 'ObjectId('7df78ad8902c)
　　　title: 'MongoDB Overview'　
　　　description: 'MongoDB不是SQL数据库'
　　　by_user: 'oldtoolbag.com',
　　　url: 'https://es.oldtoolbag.com',
　　　tags: ['mongodb', 'database', 'NoSQL'],
　　　likes:　100
},
{
　　　_id: 'ObjectId('7df78ad8902d)
　　　title: 'NoSQL Overview'　
　　　description: 'No SQL数据库是非常快的'
　　　by_user: 'oldtoolbag.com',
　　　url: 'https://es.oldtoolbag.com',
　　　tags: ['mongodb', 'database', 'NoSQL'],
　　　likes:　10
},
{
　　　_id: 'ObjectId('7df78ad8902e)
　　　title: 'Neo4j Resumen',　
　　　description: 'Neo4j es una base de datos No SQL
　　　by_user: 'Neo4j',
　　　url: 'http://www.neo4j.com',
　　　tags: ['neo4j', "database", "NoSQL"],
　　　likes:　750
},

Ahora, si se desea mostrar una lista desde la colección anterior, indicando cuántos tutoriales ha escrito cada usuario, se utilizará lo siguienteaggregate()Método-

>  db.mycol.aggregate([{$group　:　{_id　:　"$by_user",　num_tutorial　:　{$sum　:　1}}}])
{ "_id": "oldtoolbag.com", "num_tutorial":　2　}
{ "_id": "Neo4j", "num_tutorial":　1　}
>

La consulta equivalente de SQL para los casos anteriores será select by_user, count(*) from mycol group by by_user.

En el ejemplo anterior, ya hemos ordenado por el campoby_userSe ha agrupado el documento y en cada agrupación por usuario, el valor anterior de sum se aumenta. A continuación se muestra una lista de expresiones de agregación disponibles.

Expresión	Descripción	Ejemplo
$sum	Calcular la suma total.	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg	Calcular el valor promedio	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min	Obtener el valor mínimo correspondiente a todos los documentos en la colección.	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max	Obtener el valor máximo correspondiente a todos los documentos en la colección.	db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push	Insertar un valor en un array en el documento de resultados.	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet	在结果文档中插入值到一个数组中，但不创建副本。	db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first	根据资源文档的排序获取第一个文档数据。	db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last	根据资源文档的排序获取最后一个文档数据	db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

管道的概念

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式：处理输入文档并输出。表达式是无状态的，只能用于计算当前聚合管道的文档，不能处理其它的文档。

这里我们介绍一下聚合框架中常用的几个操作：

$project：修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
$match：用于过滤数据，只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

实例管道操作符

1实例 $project

db.article.aggregate(
　　　　{　$project　:　{　}}
　　　　　　　　title　:　1　,
　　　　　　　　author　:　1　,
　　　　}}
　);

De esta manera, en los resultados solo se incluirán los campos _id, tilte y author, por defecto, el campo _id se incluye. Si no se desea incluir _id, se puede hacer así:

db.article.aggregate(
　　　　{　$project　:　{　}}
　　　　　　　　_id　:　0　,
　　　　　　　　title　:　1　,
　　　　　　　　author　:　1
　　　　]]);

2.$match ejemplo

db.articles.aggregate(　[
　　　　　　　　　　　　　　　　　　　　　　　　{　$match　:　{　score　:　{　$gt　:　70,　$lte　:　90　}　}　},
　　　　　　　　　　　　　　　　　　　　　　　　{　$group:　{　_id:　null,　count:　{　$sum:　1　}}}
　　　　　　　　　　　　　　　　　　　　　　　]);

$match se utiliza para obtener registros con una puntuación mayor que70 es menor o igual que90 registros, luego envía los registros que cumplen con los criterios al siguiente operador de tubería $group.

3.$skip ejemplo

db.article.aggregate(
　　　　{　$skip　:　5　});

Después de la operación de tubería $skip, se "filtran" los primeros cinco documentos.