Thứ Ba, 26 tháng 1, 2016

Big Data #9 – Tầm quan trọng của CSDL quan hệ trong Big Data


1 Comment
 
 
 
 
 
 
4 Votes

Câu hỏi lớn?
BigData_BigQuestion
Một vài câu hỏi khi bắt đầu với big data:
  • CSDL quan hệ không có chỗ đứng trong câu chuyện big data phải không?
  • CSDL quan hệ không còn phù hợp khi big data phát triển phải không?
  • CSDL quan hệ không có khả năng xử lý big data đúng không?
  • Có đúng là không cần phải tìm hiểu CSDL quan hệ nếu big data là điểm đến cuối cùng?
Theo ý kiến cá nhân, những người tham vọng trở thành chuyên gia về big data nên tìm hiểu về CSDL quan hệ.
Phong trào NoSQL
Lý do của sự chuyển dịch sang NoSQL (phong trào NoSQL) trong thời gian gần đây là bởi 2 thuận lợi quan trọng của các CSDL NoSQL.
1. Hiệu suất (performance)
2. Tính linh động (flexible schema)
Theo kinh nghiệm cá nhân khi dùng NoSQL, tôi thấy cả hai điều thuận lợi ở trên. Nhiều trường hợp tôi thấy CSDL quan hệ có nhiều hạn chế khi dữ liệu không có cấu trúc cũng như thuộc những kiểu dữ liệu mà CSDL quan hệ không hỗ trợ. Trong trường hợp này giải pháp NoSQL thực hiện tốt hơn CSDL quan hệ. Tôi là 1 fan hâm mộ các giải pháp của NoSQL trong thời gian gần đây nhưng tôi cũng thấy các cơ hội và các tình huống nơi mà CSDL quan hệ vẫn hoàn toàn phù hợp ngay cả khi CSDL đang phát triển ngày càng lớn.
Các tình huống CSDL quan hệ
Báo cáo Adhoc là 1 trong các tình huống phổ biến nhất nơi mà NoSQL không có giải pháp tối ưu. Ví dụ các câu truy vấn báo cáo thường cần tổng hợp dựa trên các cột mà không được tạo chỉ mục cũng như được xây dựng trong khi báo cáo đang chạy, trong loại ngữ cảnh NoSQL (document database store, distributed key value store) thường không thực hiện tốt. Trong trường hợp báo cáo ad-hoc, tôi thấy CSDL quan hệ làm việc dễ hơn.
SQL là ngôn ngữ máy tính phổ biến nhất mọi thời đại. Tôi dùng nó đã rất lâu và vẫn sẽ dùng trong tương lai. Trong nhiều trường hợp, viết câu truy vấn dựa trên SQL dễ hơn viết bằng ngôn ngữ trong NoSQL. Trong tương lai có thể ngôn ngữ truy vấn trong NoSQL sẽ trở nên phổ biến.
ACID (Atomicity, Consistency Isolation Durability) – Không phải tất cả các giải pháp NoSQL cung cấp ngôn ngữ phù hợp ACID. Luôn có các tình huống (ví dụ các giao dịch ngân hàng, shopping cart trong eCommerce,…) nơi mà nếu không có ACID thì hoạt động có thể không hợp lệ và tính toàn vẹn CSDL bị ảnh hưởng.
Túi hỗn hợp
Nghe nói tất cả các site mạng xã hội ngày nay đã chuyển khỏi CSDL quan hệ. Thật sự nó không hoàn toàn đúng. Trong khi tìm hiểu về big data và CSDL quan hệ, tôi thấy nhiều site mạng xã hội phổ biến dùng các giải pháp big data cùng với CSDL quan hệ. Nhiều site mạng xã hội dùng CSDL quan hệ để cung cấp kết quả đến người dùng cuối và vẫn dùng CSDL quan hệ như hệ thống chính.
Một vài ví dụ:
Có nhiều tổ chức nổi bật đang chạy các ứng dụng lớn dùng CSDL quan hệ cùng với các nền tảng big data khác nhau để đáp ứng nhu cầu kinh doanh khác nhau của họ.
Kết luận
Tôi tin rằng RDBMS giống kem vani. Mọi người thích nó và đã có nó. NoSQL và các giải pháp khác giống như kem socolate hoặc hương vị tùy ý  – rất nhiều người thích và muốn có nó, nhưng không phải tất cả các hãng kem có thể làm cho nó hợp với khẩu vị của tất cả mọi người. Cửa hàng kem luôn có sẵn kem vani. Cũng giống như vậy, trong câu chuyện big data, CSDL quan hệ là 1 phần của cả câu chuyện. Trong thế giới thực sẽ luôn cần CSDL quan hệ. CSDL quan hệ là 1 trong những thành phần quan trọng của big data thay vì xem nó là công nghệ chưa đáp ứng tiêu chuẩn.
Ray of Hope – NewSQL
Chúng ta đã từng nói rằng có những tình huống cần đến ACID trong ứng dụng big data và NoSQL sẽ không hỗ trợ điều này. Có 1 thuật ngữ mới hỗ trợ hầu hết các thuộc tính của RDBMS và hỗ trợ hạ tầng big data – NewSQL.
 (Theo http://blog

0 nhận xét: