Có cách nào kiểm soát siêu khổng lồ “Big Data”?
Dữ Liệu Lớn, như tên gọi của nó, là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và phức tạp đến nỗi những công cụ, ứng dụng xử lý dữ liệu truyền thống không thể đảm đương được. Ý tưởng cơ bản đứng sau cụm từ “Dữ liệu lớn”là tất cả những gì chúng ta làm trong đời đều để lại, hoặc sẽ sớm để lại một dấu vết kỹ thuật số (hoặc dữ liệu) có thể được sử dụng hoặc phân tích.
Là một trong những hạt nhân của Cuộc cách mạng 4.0, Big Data, trong mỗi giây, có thể tạo ra lượng dữ liệu khổng lồ và đa dạng, từ dữ liệu tài chính cho đến tin tức truyền thông xã hội, từ ảnh chụp cho đến dữ liệu cảm biến, từ băng video cho đến băng ghi âm giọng nói. Mặc dù Big Data đã cách mạng hóa ngành công nghiệp, nâng bước giấc mơ triệu phú của nhiều người – nhưng cũng chính bóng hình khổng lồ ấy đã trở thành nỗi sợ của nhiều người đang bị choáng ngợp trong thế kỷ của đại dương dữ liệu.
Nỗi sợ đó đã được Bernard Marr – bậc thầy về Dữ Liệu Lớn hóa giải: chúng ta chỉ sợ một thứ khi chưa hiểu rõ về nó. Trong cuốn sách của mình, ông khẳng định rằng các cá nhân, chính phủ và đặc biệt là doanh nghiệp, bất kể quy mô và nguồn vốn, có thể làm chủ, tận dụng tính ưu việt của Dữ Liệu Lớn để đưa ra quyết định đúng đắn và cải thiện hiệu suất nếu đi theo lộ trình S-M-A-R-T.
Nói ngắn gọn, giá trị không đến từ bản thân Dữ liệu mà đến từ những gì chúng ta có thể tận dụng từ nó. Nếu nắm bắt được kỹ nghệ, ta hoàn toàn có thể biến “phế phẩm” thành “sản phẩm”. Chẳng hạn, Facebook đã quan sát toàn bộ dữ liệu họ có thông qua hàng triệu dòng cập nhật trạng thái và có thể giải mã một hành vi xung quanh các mối quan hệ từ sự hỗn loạn đó, đến mức Facebook có thể dự đoán khi nào bạn sẽ thay đổi trạng thái từ “Độc thân (Single) sang “Trong một mối quan hệ (In a relationship)” và ngược lại. Hiện tại, đó chỉ là một sự thấu hiểu vu vơ và kỳ quặc, nhưng sẽ đến lúc Facebook có thể cấp phép cho các công ty khác sử dụng dữ liệu đó – những công ty chuyên sản xuất các sản phẩm đặc biệt hữu ích cho những người mới bắt đầu một mối quan hệ (các gói du lịch dành cho cặp đôi) hoặc mới chia tay (khăn giấy và kem Ben&Jerry!).
Trong kinh doanh, các nhà bán lẻ có thể sử dụng dữ liệu để quyết định hàng hóa nên được trưng bày ở đâu, cửa hàng nào bán tốt nhất loại sản phẩm cụ thể nào và theo dõi lối di chuyển của khách hàng cửa hàng. Thẻ khách hàng thân thiết không còn mới lạ nhưng các phân tích phức tạp hơn về sở thích của khách hàng sẽ giúp các nhà bán lẻ có thể dự đoán tốt hơn những gì bạn sẽ mua. Thậm chí, chúng còn phát triển đến mức Amazon tin rằng họ sẽ sớm có thể dự đoán chính xác bạn sẽ mua món đồ gì, đủ để gửi nó đến cho bạn trước cả khi bạn đặt hàng!
Đáng lưu ý, tác giả, trong nỗ lực giải mã Dữ Liệu Lớn, luôn cố gắng vẽ bức tranh khách quan nhất về giải pháp này. Ông thẳng thắn chỉ ra mối đe dọa của nó tới quyền riêng tư của mỗi người và đặt ra câu hỏi về luân lý đạo đức ẩn sau sự kiểm soát thông tin thiếu minh bạch của các doanh nghiệp và chính phủ. Tuy nhiên, ông cũng lật lại vấn đề, rằng nếu sự giám sát đó giúp phát hiện kịp thời các nguy cơ khủng bố và tội phạm thì lợi ích Dữ liệu lớn và các phương pháp phân tích mang lại còn có tầm quan trọng bao trùm toàn xã hội.
Bên cạnh đó, việc doanh nghiệp sử dụng dữ liệu để điều chỉnh hình thức chào bán riêng biệt với mỗi khách hàng cũng tiềm ẩn một sự bất công. Trên lý thuyết, có người sẽ bị tính phí bảo hiểm cao hơn hoặc bị từ chối vay chỉ vì rơi vào nhóm này hoặc nhóm khác mặc dù những hành xử được sử dụng làm căn cứ chỉ là một lát cắt quá nhỏ để nói lên khuynh hướng và danh tính một con người.
Tóm lại, bức tranh Dữ Liệu Lớn vẫn còn điểm xuyết những mảng tối, những nỗi sợ và mơ hồ nhưng, như thông điệp tác giả lựa chọn để kết thúc cuốn sách, “Cách tốt nhất để lường trước tương lai là tạo ra nó.” Hơn hết, tác giả mong muốn tương lai đó cần hòa nhập và thân thiện cho tất cả chứ không chỉ là cuộc chơi giữa những ông lớn.