Corona: Ảo thuật đằng sau những con số "khoa học"

14.840 và 1.638, số nào lớn hơn? 14.840 phải không? Sai! Số ca nhiễm hiện nay là 74.185? Sai! Nó phải lớn hơn 430.651! Nơi nào đưa tin giả về corona nhiều nhất? Mạng xã hội? Sai! Bạn biết nguồn tin giả lớn nhất trong vụ này là đâu không? Trước khi so sánh các con số, trước hết chúng ta phải hiểu được bản chất của nó. Một con số đo lường có hai vấn đề: validity và reliability. Nếu con số không có valid hoặc kém reliable thì không thể so sánh. Source: fb.com/hodacnguyennga/posts/10218039353148048

14.840 và 1.638, số nào lớn hơn? 14.840 phải không? Sai!

Số ca nhiễm hiện nay là 74.185? Sai! Nó phải lớn hơn 430.651!

Nơi nào đưa tin giả về corona nhiều nhất? Mạng xã hội? Sai! Bạn biết nguồn tin giả lớn nhất trong vụ này là đâu không?

Trước khi so sánh các con số, trước hết chúng ta phải hiểu được bản chất của nó. Một con số đo lường có hai vấn đề: validity và reliability. Nếu con số không có valid hoặc kém reliable thì không thể so sánh.

Validity: con số chúng ta đo có phải thật sự là con số chúng ta muốn đo hay không? Ví dụ 1 bạn muốn đo cân nặng của mình, bạn ấy bước lên cái cân nhưng quên bỏ cái ba lô trên lưng ra. Số cân đó có phải là cân nặng của bạn ấy không?

14.840 và 1.638 là số "người bị nhiễm corona" được China báo cáo trong ngày 12/2 và 11/2 ở Hồ Bắc. Nhưng thật ra, đây là 2 con số khác nhau. 1.638 là số người có xét nghiệm dương tính. 14.840 là số người có xét nghiệm dương tính cộng với số người có tổn thương phổi trên phim X-ray. Vậy nên 2 con số đó đo 2 thứ khác nhau, không thể so sánh được. Và cả hai đều có vấn đề về validity. Hơn nữa, có rất nhiều người nhiễm corona ở China không được xét nghiệm và không được chụp hình phổi. Nói cách khác, cả hai con số đó không phản ánh được số người nhiễm corona ở China.

Reliability: con số chúng ta đo có giống nhau trong nhiều lần đo không? Ví dụ 1 bạn muốn đo cân nặng của mình, bạn ấy bước lên cái cân. Cái cân 1: lần 1 là 50 kg; lần 2 là 50.1 kg; lần 3 là 49.9 kg. Cái cân 2: lần 1 là 50 kg; lần 2 là 60 kg; lần 3 là 40 kg. Chúng ta nói cái cân 1 là reliable còn cái cân 2 là không có reliable. Nếu cái cân là không reliable thì không so sánh được.

Hiện nay, cả xét nghiệm và xem hình phổi đều không có reliable để xác định được tình trạng nhiễm corona. Nói cách khác, không những hai con số 14.840 và 1.638 là không valid, nó cũng không có reliable. Tóm lại, hai con số đó chỉ để tham khảo thôi chứ không thể dùng vào bất kỳ so sánh hay hoạch định chính sách nào được.

China còn lợi dụng những con số này để làm ảo thuật nữa. Nếu 14.840 và 1.638 là hai loại số đo khác nhau, làm sao có thể cộng chúng lại với nhau được? Bạn có thể nào cộng 10 con bò và 100 con gà lại với nhau rồi nói bạn có 110 con bò không? Vậy mà China làm được mấy hay! Vậy mà có nhiều nhà "khoa học" sử dụng số liệu này để tính toán mới sợ chứ!

Trong 74.185 số ca "nhiễm" cho đến hôm nay, 45.170 ca từ 11/2 trở về trước là số người dương tính xét nghiệm, 20.015 ca từ 12/2 trở đi là theo cách tính mới (số ca dương tính xét nghiệm + số ca hình phổi tổn thương). Nếu giả sử số ca nhiễm không tăng đột biến trong 1 ngày và tỷ lệ số ca dương tính xét nghiệm trên tổng số ca là ít thay đổi: 1.638/14.840= 11%. Tổng số ca từ 11/2 trở về trước phải là 45.170/11% = 410.636. China đã giấu 410.636 * 89%= 365.466 ca giữa thanh thiên bạch nhật mà không ai phát hiện ra (ít ra là chưa thấy ai lên tiếng). Đúng ra, số ca nhiễm là: 410.636 + 20.015 = 430.651 ca. Đó chỉ là số ca được xác nhận bằng xét nghiệm và hình phổi, chưa kể xét nghiệm false negative, bị nhiễm chưa có tổn thương phổi, và những người chưa được xét nghiệm hay chụp hình.

Chỉ bằng 1 động tác lừa đảo đơn giản, cộng bò với gà, China đã lừa cả thế giới rằng số ca nhiễm là 74.185 trong khi thật ra là nó lớn hơn 430.651 ca. Trùm tin giả là đây chứ đâu!

Và thế, nguồn tin giả này được báo đài các nước loan đi, các nhà khoa học tính toán, các quốc gia sử dụng để ra quyết định. Hậu quả lớn cỡ nào?

Mạng xã hội có tin giả? Đúng! Nhưng tin giả trên mạng xã hội là random noise, tức là những sai số lẻ tẻ, tuy có nhiều tin giả nhưng khác nhau, thậm chí trái ngược nhau. Do đó, trên tổng thể nó sẽ bị bù trừ lẫn nhau.

Cái đáng sợ là systemetic error, tức là sai số hệ thống. Giống như trường hợp Tàu đưa tin giả lừa cả thế giới. Báo chí dựa vào đó đưa tin, các nhà khoa học dựa vào đó tính toán, các quốc gia sử dụng nó để ra quyết định, thậm chí là mạng xã hội cũng dựa vào nó để bàn luận. Cái tin giả hệ thống này làm sai nguyên cả hệ thống y tế, khoa học, xã hội, và chính trị trên toàn thế giới, dẫn đến thiệt hại về sức khoẻ và sinh mạng của rất nhiều người.

Nếu 1 bạn đưa tin giả 1 người bị nhiễm ở Đồng Nai bị công an bắt, việc Tàu giấu cả thế giới 365.466 ca bị nhiễm thì phải xử lý thế nào?

Nga Ho-Dac (Gs. Đại học San Francisco)
Bài về chủ đề Giả dối-Ảo tưởng:
Về đầu trang