"Vết tích kỹ thuật số"
"Mỗi dữ liệu mà chúng ta hay gọi là Big Data đều thực sự là những mỏ vàng là nguyên liệu là nguồn tạo ra công ăn việc làm", một doanh nhân chuyên thu thập, phân tích và bán lại cho khách hàng những khối dữ liệu cá nhân khổng lồ của hàng triệu, hàng tỷ người dùng những phương tiện kết nối (connected), ví mỏ thông tin như những mỏ vàng hay dầu hỏa được phát hiện hồi thế kỷ 19 và 20.
Mỗi chúng ta khi đặt mua vé tàu hỏa hay vé máy bay qua mạng, khi tìm kiếm một thông tin trên internet, hay điện thoại di động, rút tiền ở các quầy tự động bằng thẻ tín dụng, kết nối vào các mạng xã hội... đều để lại vô vàn những "vết tích kỹ thuật số". Số này được lưu trữ lại một cách cẩn thận trước khi được xếp đặt lại theo một trật tự nào đó trước khi được sử dụng.
Những dữ liệu đó được gọi là Big Data, đơn giản là vì đấy là những thông tin thu thập được với một dung lượng rất lớn. Mỗi ngày các hãng trong ngành thu thập được hàng tỷ những octet (đơn vị thông tin trong điện toán và viễn thông gồm có tám bit).
Công cụ để mổ xẻ, hay xắp xếp lại những "big data" là algorithm, tức là một hệ thống các quy trình giải quyết dữ liệu theo một trật tự được lập trình bởi những thông số nhất định.
Vậy những thông tin nào liên quan tới đời sống của mỗi con người trong chúng ta được các hãng mua "data" lưu ý? Thật ra tất cả mọi chi tiết trong đời sống riêng tư của mỗi cá nhân đều quan trọng. Từ màu tóc hay màu mắt của bạn, đến họ, tên tuổi tác, chỗ ở, sở thích của bạn ... đều là những cổng vào mở ra những thị trường màu mỡ.
Một hãng mỹ phẩm sẽ chú ý nhiều đến màu da, đến màu tóc của bạn, họ muốn biết bạn có bị dị ứng hay không, để chế biến và quảng cáo những sản phẩm phù hợp nhất với bạn. Còn nếu là một hãng quần áo thì những thông tin như là tuổi tác, nơi bạn sống lại có giá trị hơn.
Một nhà môi giới mua bán Big Data giải thích: "Chúng tôi cần thông tin về địa chỉ, số điện thoại, hộp thư điện tử, tài khoản Facebook và nếu như chúng tôi theo dõi như vậy là để phục vụ họ tốt hơn. Chẳng hạn như là gửi các chương trình khuyến mãi riêng cho từng người, tặng quà cho họ".
Bạn có biết là mỗi ngày trên thế giới, nhân loại thải ra một khối lượng dữ liệu khổng lồ, cần có tới 2,5 ngàn tỷ octet để lưu trữ trên máy tính. Cứ khoảng 18 tháng, khối lượng "Big Data" lưu hành trên toàn cầu lại được nhân lên gấp đôi.
Chiến lược săn lùng thông tin cá nhân
Bên cạnh những thông tin mà người sử dụng internet hay bất kỳ một phương tiện kết nối nào "tự nguyện" tặng không cho các hãng thu thập data, thì các công ty trong thời đại kỹ thuật số còn có hẳn những chiến lược để săn lùng những thông tin cá nhân. Florent Douetteau, sáng lập viên hãng Dataiku, chuyên thu thập và phân tích các dữ liệu cá nhân để cung cấp cho khách hàng, giải thích:
"Mỗi khi cung cấp một sản phẩm chúng tôi phải nghĩ cách nào để thu thập được những thông tin và nhất là cách để khai thác những thông tin đó. Tôi lấy ví dụ cụ thể như là xe hơi: Trong xe có rất nhiều những chíp điện tử để thu thập thông tin về phong cách lái của chủ nhân chiếc xe, về nhu cầu sử dụng xe của người đó… từ những thông tin này, hãng xe đào sâu thêm để cho ra đời loại xe không người lái sau này.
Hãng Dataiku của chúng tôi cung cấp phần mềm để phân tích những dữ liệu một cách hiệu quả nhất. Phải xem các thông tin chúng ta thu thập được như là những chất liệu nguyên thủy. Chúng cần được sàng lọc, phân tích thì mới có thể bán cho các công ty và những công ty này dùng chúng để đáp ứng nhu cầu của người tiêu dùng.
Ví dụ như trong các dịch vụ mua bán trên mạng, mỗi cá nhân có một số những thông tin cần thiết hay là những chương trình quảng cáo khác nhau hiện lên màn hình khi họ mở máy tính bảng, computer hoặc điện thoại di động. Đây là điều hết sức quan trọng trong chiến lược khuyến mãi của các hãng mua bán trên mạng.
Chúng ta biết rằng, khi bạn tìm một sản phẩm hay một thông tin nào đó trên mạng, 10 đề nghị đầu tiên xuất hiện trên màn ảnh là quan trọng nhất. Thành ra nhà cung cấp nào cũng muốn có tên trong danh sách đầu tiên đó".
Cần nói thêm là có hai loại data, một số cần phải sàng lọc trước khi có thể sử dụng, số khác có thể dùng vào các mục đích thương mại ngay lập tức. Như giải thích cụ thể sau đây của Romain Sambarino, sáng lập viên công ty khởi nghiệp Allo Media:
"Nguồn cung cấp dữ liệu quan trọng nhất tới nay vẫn là những trao đổi qua điện thoại khi cần một dịch vụ nào. Ví dụ về hàng tỷ cú điện thoại, đây là một mỏ vàng vô cùng quý giá. Khi gọi điện để đặt một tua du lịch, khách hàng nói rõ: họ muốn tham quan thành phố nào, đến đó để làm gì … Đây là những dữ liệu có thể khai thác được ngay, mà không phải phân tích hay chọn lọc".
Nói như vậy mỗi người sử dụng internet hay các dụng cụ kết nối đều là những con gà đẻ trứng vàng, càng xuất hiện trên mạng càng cung cấp nhiều thông tin miễn phí cho các hãng môi giới mua bán Big Data.
“Những danh sách đáng sợ”
Thật ra một mạng xã hội như Facebook không bán trực tiếp các dữ liệu cá nhân của người sử dụng cho các hãng quảng cáo nhưng khi 2,13 tỷ người có tài khoản Facebook "lướt" trên mạng trung bình một tiếng mỗi ngày, thì Facebook trở thành tủ kính quảng cáo lớn nhất thế giới.
Máy tính bảng, máy tính bàn hoặc điện thoại di động trở thành những "không gian" vô cùng quý giá cho các nhà quảng cáo, với một lợi thế mà các phương tiện quảng cáo truyền thống (như vô tuyến, radio hay báo chí) không có được.
Đó là các chương trình quảng cáo trên Facebook của mỗi cá nhân chỉ dành riêng cho người đó và để đáp ứng những nhu cầu của riêng người đang mở Facebook này mà thôi. Nhờ thế mà năm 2017 tập đoàn do Mark Zuckerberg sáng lập lãi 16 tỷ USD và 98% khoản tiền đó có được là nhờ quảng cáo.
Nhưng dịch vụ mua bán dữ liệu không dừng lại ở đây. Giáo sư Bernard Harcourt (Đại học Colombia, New York), cho biết:
"Có những danh sách đáng sợ hiện đang lưu hành. Ở Mỹ chẳng hạn có nhiều công ty bán những danh sách với rất nhiều các dữ liệu cho khách hàng. Cứ 79 USD thì có được thông tin liên quan tới 1000 người. Những thông tin đó bao gồm đủ mọi cấp, như là nhóm 1000 người đó có bị nhiễm HIV hay không, họ có bị dị ứng hay không, có nghiện rượu, nghiện thuốc lá hay không. Với những dữ liệu đó người ta có thể lập ra những chương trình quảng cáo nhắm vào một số đối tượng".
Chưa kể là những thông tin này còn được các hãng bảo hiểm, ngân hàng khai thác. Từ những dữ liệu thô cho đến khi lập được ra những chương trình quảng cáo nhắm vào một đối tượng không phải là chuyện dễ. Công đoạn này đòi hỏi phải có chuyên viên.
Giới trong ngành cho biết, trong bốn năm tới, các công ty chuyên khai thác Big Data cần tuyển dụng thêm 200.000 nhân viên. Tại châu Âu, lương hàng năm trung bình khi một người vừa bước vào nghề là 45 ngàn USD và số lương đó "được tăng lên gấp đôi trong một thời gian ngắn kỷ lục".
Florent Georges, sáng lập viên công ty môi giới tuyển dụng nhân sự Aquila Consulting nói đến hiện tượng săn lùng các kỹ thuật viên vất vả như thế nào: "Có thể nói tới hiện tượng tìm không ra chuyên viên. Đó là điều tôi phải chứng kiến hàng ngày.
Nhiều khách hàng thúc hối tôi tìm được các chuyên gia để phân tích các dữ liệu, nhưng thường thì chúng tôi phải tuyển dụng các kỹ sư điện toán, rồi đào tạo thêm cho họ về chuyên môn này. Đôi khi chúng tôi phải tuyển dụng các kỹ sư của nước ngoài, chẳng hạn như là người Colombia, người Rumani hay từ nhiều nước ở Bắc Phi".
Chính vì Big Data là con gà đẻ trứng vàng, mà các nhà cung cấp dịch vụ trên mạng cần tạo uy tín với người sử dụng. Cùng cung cấp một dịch vụ tương đương, người ta có khuynh hướng giao dịch với những tên tuổi có uy tín.
Tạo niềm tin và uy tín với người sử dụng bắt buộc các nhà cung cấp phải tuyển dụng thêm nhân viên, tăng cường các công cụ kỹ thuật… Đây không chỉ là thách thức với riêng gì Google hay Facebook mà là của chung tất cả các cổng vào và trang mạng trên internet.