Thuật toán Google có thể dự đoán dịch bệnh trước khi chính phủ công bố

Năm 2009, khi dịch cúm H1N1 lan ra khắp nước Mỹ, một hệ thống kỳ lạ của Google đã phát hiện ra điều đó sớm hơn cả Cơ quan Kiểm soát và Phòng ngừa dịch bệnh (CDC). Trong khi các báo cáo y tế vẫn đang tổng hợp dữ liệu phòng khám, Google đã nhìn thấy “cơn sốt” đang đến – không phải qua bệnh án, mà qua từ khóa tìm kiếm của hàng triệu người dùng.

Dự án ấy mang tên Google Flu Trends (GFT). Thuật toán của nó theo dõi tần suất những cụm từ như “đau họng”, “sốt cao”, “thuốc cảm cúm”… trên khắp thế giới. Khi số lượt tìm kiếm tăng bất thường trong một khu vực, hệ thống sẽ cảnh báo sớm về nguy cơ bùng phát dịch.

Kết quả ban đầu rất ấn tượng. Trong giai đoạn 2008–2012, nhiều khi GFT phát hiện xu hướng tăng của bệnh cúm sớm hơn báo cáo chính thức đến hai tuần. Với một dịch bệnh lây nhanh, hai tuần có thể là khoảng thời gian quý giá để chuẩn bị giường bệnh, vaccine, hay chiến dịch tuyên truyền.

Nhưng rồi, “nhà tiên tri” ấy vấp phải giới hạn của chính mình. Năm 2013, GFT dự đoán sai nghiêm trọng, ước tính số ca cúm cao hơn thực tế gần gấp đôi. Lý do không nằm ở virus, mà ở con người. Truyền thông lúc đó nói nhiều về cúm, khiến hàng triệu người tìm kiếm triệu chứng dù chưa hề mắc bệnh. Thuật toán, vốn chỉ đọc dữ liệu, không hiểu được sự khác biệt giữa lo lắng và lây nhiễm thật.

image 26
Ảnh minh hoạ.

Sau thất bại đó, Google Flu Trends bị dừng lại, nhưng ý tưởng của nó vẫn sống. Các nhà khoa học tiếp tục phát triển phương pháp “dịch tễ học kỹ thuật số” (digital epidemiology) – dùng dữ liệu internet để theo dõi sức khỏe cộng đồng. Trong đại dịch COVID-19, dữ liệu từ Google Trends, Twitter, và Wikipedia được kết hợp với hệ thống y tế để dự báo đợt bùng phát và sự lan truyền của biến thể mới. Một nghiên cứu năm 2025 trên Nature Scientific Data cho thấy, Google Trends về các triệu chứng kéo dài của COVID-19 có thể dự đoán mức độ phổ biến của bệnh ở nhiều khu vực.

Cơ chế này nghe có vẻ phức tạp, nhưng thực chất lại rất gần gũi: trước khi người ta đi khám, họ tra Google. Trước khi chính quyền thống kê, dữ liệu tìm kiếm đã phác lại nỗi lo chung. Dưới góc nhìn dữ liệu lớn, hành vi của hàng triệu người bình thường tạo thành “nhịp tim tập thể” của xã hội, có thể tiết lộ điều gì sắp đến.

Dẫu vậy, không ai coi Google là bác sĩ. Các nhà nghiên cứu gọi đây là “dấu hiệu sớm hành vi” – phản ánh cảm xúc và mối quan tâm của con người nhiều hơn tình hình y tế thực tế. Dữ liệu có thể dự đoán dịch, nhưng cũng có thể “bắt nhầm” nỗi sợ.

Ngày nay, khi trí tuệ nhân tạo được huấn luyện trên hàng tỷ từ khóa mỗi ngày, khả năng “cảm nhận dịch bệnh” từ internet vẫn đang tiến hóa. Google Flu Trends có thể đã thất bại, nhưng nó mở ra một câu hỏi vẫn còn nguyên sức nặng:

Nếu dữ liệu biết trước khi con người biết, thì ai mới thực sự là người quan sát thế giới?

Có thể bạn quan tâm

Đã phát hiện trình chặn quảng cáo

Hãy ủng hộ chúng tôi bằng cách vô hiệu hóa trình chặn quảng cáo trên trình duyệt của bạn hoặc chuyển sang một trình duyệt khác để tiếp tục!