- Bài 1: MongoDB - Tổng quan
- Bài 2: MongoDB - Điểm mạnh và lợi thế
- Bài 3: MongoDB - Thiết lập môi trường
- Bài 4: MongoDB - Mô hình dữ liệu
- Bài 5: MongoDB - Tạo Database
- Bài 6: MongoDB - Xoá Database
- Bài 7: MongoDB - Tạo Collection
- Bài 8: MongoDB - Xoá Colleciton
- Bài 9: MongoDB - Kiểu dữ liệu
- Bài 10: MongoDB - chèn Document
- Bài 11: MongoDB - truy vấn Document
- Bài 12: MongoDB - Cập nhật Document
- Bài 13: MongoDB - Xoá Document
- Bài 14: MongoDB - Projection
- Bài 15: MongoDB - Giới hạn bản ghi
- Bài 16: MongoDB - Sắp xếp bản ghi
- Bài 17: Mongodb - Index
- Bài 18: MongoDB - Aggregation
- Bài 19: MongoDB - Replication
- Bài 20: MongoDB - Shard
- Bài 21: MongoDB - Tạo backup
- Bài 22: MongoDB - Triển khai
- Bài 23: MongoDB - Java(P1)
- Bài 24: MongoDB - Java(p2)
- Bài 25: MongoDB - PHP
- Bài 26: MongoDB - Relationship
- Bài 27: MongoDB - Tham chiếu database
- Bài 28: MongoDB - Truy vấn Covered
- Bài 29: MongoDB - Phân tích truy vấn
- Bài 30: MongoDB - Toán tử Atomic
- Bài 31: MongoDB - Chỉ mục nâng cao
- Bài 32: MongoDB - Hạn chế chỉ mục (index)
- Bài 33: MongoDB - ObjectID
- Bài 34: MongoDB - Map Reduce
- Bài 35: MongoDB - Text Search
- Bài 36: MongoDB - Regular Expression
- Bài 37: MongoDB - Rockmongo
- Bài 38: MongoDB - GridFS
- Bài 39: MongoDB - Capped Collection
- Bài 40: MongoDB - Auto-Increment
Bài 34: MongoDB - Map Reduce - MongoDB
Đăng bởi: Admin | Lượt xem: 1111 | Chuyên mục: SQL
Trong MongoDB Documentation, Map-Reduce là một hệ xử lý dữ liệu để cô đọng một khối lượng lớn dữ liệu thành các kết quả tổng thể có ích. MongoDB sử dụng lệnh mapReduce cho hoạt động Map-Reduce. Nói chung, Map Reduce được sử dụng để xử lý các tập dữ liệu lớn.
1. MapReduce trong MongoDB
Cú pháp cơ bản của lệnh mapReduce như sau:
>db.collection.mapReduce(
function() {emit(key,value);}, //map function
function(key,values) {return reduceFunction}, //reduce function
{
out: collection,
query: document,
sort: document,
limit: number
}
)
Đầu tiên, hàm (function) của Map Reduce truy vấn Collection, sau đó ánh xạ các Document kết quả để phát xạ (Emit) các cặp key-value mà sau đó bị rút gọn dựa trên các key mà có nhiều value.
Trong cú pháp trên:
- map là một hàm JavaScript mà ánh xạ một value với một key và phát xạ một cặp key-value.
- reduce là một hàm JavaScript mà rút gọn hoặc nhóm tất cả Document có cùng key.
- out xác định vị trí của kết quả truy vấn Map-Reduce.
- query xác định tiêu chuẩn chọn tùy ý để lựa chọn các Document.
- sort xác định tiêu chuẩn sắp xếp tùy ý.
- limit xác định số lượng Document tối đa tùy ý để được trả về.
2. Sử dụng MapReduce trong MongoDB
Bạn theo dõi cấu trúc của Document để lưu giữ User Post. Document này lưu giữ user_name của người dùng và status của Post.
{
"post_text": "tutorialspoint is an awesome website for tutorials",
"user_name": "mark",
"status":"active"
}
Bây giờ, chúng ta sẽ sử dụng một hàm mapReduce trên các posts collection để lựa chọn tất cả các active post, nhóm chúng lại dựa trên user_name và sau đó đếm số lượng post của mỗi user bởi sử dụng code sau:
>db.posts.mapReduce(
function() { emit(this.user_id,1); },
function(key, values) {return Array.sum(values)},
{
query:{status:"active"},
out:"post_total"
}
)
Truy vấn mapReduce trên sẽ cho kết quả:
{
"result" : "post_total",
"timeMillis" : 9,
"counts" : {
"input" : 4,
"emit" : 4,
"reduce" : 2,
"output" : 2
},
"ok" : 1,
}
Kết quả chỉ ra rằng, tổng số 4 Document đã kết nối với truy vấn (status:"active"), hàm map phát xạ 4 Document với các cặp key-value và cuối cùng hàm reduce nhóm các Document đã ánh xạ có cùng key vào trong 2.
Để xem kết quả của truy vấn mapReduce này, bạn sử dụng toán tử find:
>db.posts.mapReduce(
function() { emit(this.user_id,1); },
function(key, values) {return Array.sum(values)},
{
query:{status:"active"},
out:"post_total"
}
).find()
Truy vấn trên cung cấp kết quả chỉ ra rằng cả hai người dùng tom và mark có hai posts trong trạng thái là active.
{ "_id" : "tom", "value" : 2 }
{ "_id" : "mark", "value" : 2 }
Theo phương thức tương tự, các truy vấn MapReduce có thể được sử dụng để xây dựng các truy vấn Aggregation phức tạp. Sự sử dụng của các hàm JavaScript tùy biến giúp cho việc sử dụng MapReduce thêm linh động và mạnh mẽ hơn.
Theo dõi VnCoder trên Facebook, để cập nhật những bài viết, tin tức và khoá học mới nhất!
- Bài 1: MongoDB - Tổng quan
- Bài 2: MongoDB - Điểm mạnh và lợi thế
- Bài 3: MongoDB - Thiết lập môi trường
- Bài 4: MongoDB - Mô hình dữ liệu
- Bài 5: MongoDB - Tạo Database
- Bài 6: MongoDB - Xoá Database
- Bài 7: MongoDB - Tạo Collection
- Bài 8: MongoDB - Xoá Colleciton
- Bài 9: MongoDB - Kiểu dữ liệu
- Bài 10: MongoDB - chèn Document
- Bài 11: MongoDB - truy vấn Document
- Bài 12: MongoDB - Cập nhật Document
- Bài 13: MongoDB - Xoá Document
- Bài 14: MongoDB - Projection
- Bài 15: MongoDB - Giới hạn bản ghi
- Bài 16: MongoDB - Sắp xếp bản ghi
- Bài 17: Mongodb - Index
- Bài 18: MongoDB - Aggregation
- Bài 19: MongoDB - Replication
- Bài 20: MongoDB - Shard
- Bài 21: MongoDB - Tạo backup
- Bài 22: MongoDB - Triển khai
- Bài 23: MongoDB - Java(P1)
- Bài 24: MongoDB - Java(p2)
- Bài 25: MongoDB - PHP
- Bài 26: MongoDB - Relationship
- Bài 27: MongoDB - Tham chiếu database
- Bài 28: MongoDB - Truy vấn Covered
- Bài 29: MongoDB - Phân tích truy vấn
- Bài 30: MongoDB - Toán tử Atomic
- Bài 31: MongoDB - Chỉ mục nâng cao
- Bài 32: MongoDB - Hạn chế chỉ mục (index)
- Bài 33: MongoDB - ObjectID
- Bài 34: MongoDB - Map Reduce
- Bài 35: MongoDB - Text Search
- Bài 36: MongoDB - Regular Expression
- Bài 37: MongoDB - Rockmongo
- Bài 38: MongoDB - GridFS
- Bài 39: MongoDB - Capped Collection
- Bài 40: MongoDB - Auto-Increment