แนวเดียวกับ How to lie with statistics ของ Darrell Huff หนังสือที่ขึ้นหิ้งคลาสสิกเมื่อเกือบ 70 ปีก่อน แต่เข้ากับยุค big data มากกว่า สนุกและสะเทือนใจกว่า แน่นอนว่าตัวเลขมีพลังโน้มน้าวและช่วยในการตัดสินใจ เธอยกตัวอย่างไนติงเกลใช้พลังของตัวเลขเพื่อขอการสนับสนุนจากรัฐบาล และก็แน่นอนเช่นกันว่า อำนาจของตัวเลขที่ถูกใช้อย่างผิด ๆ ก็สร้างปัญหา (เพิ่งรู้จากหนังสือเล่มนี้ว่า Huff เองเคยรับเงินจากบริษัทยาสูบเพื่อตั้งข้อกังขาระหว่าง correlation กับ causation ในรายงานวิจัยทางการแพทย์ ระหว่างตัวแปรการสูบบุหรี่กับมะเร็ง) โดยเฉพาะการใช้ตัวเลขที่พยายามใช้เป็นตัวแทนของนามธรรมบางอย่างเพื่อทำนายอนาคต อาทิ ความฉลาด หรือความสามารถในการจ่ายหนี้ตามเวลา

ขอยกตัวอย่างหนึ่งที่ชอบ คือการทดลองของ Roland Fryer แบ่งเด็กออกเป็น 3 กลุ่ม 'นายจ้าง' 'คนหางานสีเขียว' กับ 'คนหางานสีม่วง' นายจ้างจะจ้างหรือไม่จ้างโดยรู้ข้อมูลสามชิ้น 1. สีของคนหางาน, 2. คะแนนสอบเข้าทำงาน และ 3. ข้อมูลสถิติว่าที่ผ่านมาว่าคนสีเขียวถูกจ้างกี่คน สีม่วงถูกจ้างกี่คน และได้ผลตอบแทนเท่าไร โดยเกมจะเล่นกันหลายรอบ แต่ละรอบจับคู่ให้นายจ้างเจอกับคนหางาน แล้วนายจ้างต้องตัดสินใจ ถ้านายจ้างจ้างคนมีการศึกษา นายจ้างจะได้เงินเยอะกว่าการไม่จ้าง ซึ่งการไม่จ้างก็ได้เงินเหมือนกันนะ แต่ถ้านายจ้างจ้างคนไม่มีการศึกษา นายจ้างจะไม่ได้เงินเลย คนหางานไม่ว่าสีอะไรก็ตามสามารถเอาเงินที่ได้จากเกมไปลงทุนในการศึกษา ถ้าใครที่ลงทุนในการศึกษา จะทำให้โอกาสทำข้อสอบเข้าทำงานได้คะแนนเยอะกว่าคนที่ไม่มีการศึกษา (ระบบการทำข้อสอบของเกมนี้คือ มีถุงใส่ลูกแก้ว 2 ถุง แต่ละถุงมีลูกแก้ว 6 ลูก ถุงแรกมีสีฟ้า 3 สีแดง 3, ถุงที่สองมีสีฟ้า 1 สีแดง 5, สีฟ้าแทนทำข้อสอบถูก สีแดงแทนทำข้อสอบผิด, โดยจะสุ่มหยิบ 2 ครั้งแบบหยิบแล้วใส่คืน เสมือนทำข้อสอบสองข้อ และคนที่ลงทุนในการศึกษา จะได้สุ่มหยิบจากถุงแรก ส่วนคนที่ไม่มีการศึกษาจะสุ่มหยิบจากถุงหลัง, ฉะนั้นถ้าหยิบได้ ฟ้า-ฟ้า โอกาสที่จะเป็นคนมีการศึกษาก็มีมากกว่าโอกาสที่ไม่มีการศึกษาเยอะ ส่งสัญญาณให้นายจ้างจ้าง ขณะที่แดง-แดง ก็มีโอกาสเป็นคนไม่มีการศึกษามากกว่ามีการศึกษาเยอะ ส่งสัญญาณให้นายจ้างไม่จ้าง สำหรับกรณีฟ้า-แดง โอกาสเป็นคนมีการศึกษามากกว่าโอกาสเป็นคนไม่มีการศึกษาไม่เยอะเท่ากรณีฟ้า-ฟ้า นายจ้างอาจต้องตัดสินใจจากตัวแปรตัวอื่น)
ในการเล่นเกมรอบแรก กลุ่มสีม่วงลงทุนในการศึกษาน้อยกว่ากลุ่มสีเขียวเล็กน้อย (ไม่เกี่ยวอะไรกับสี เพราะสีถูกกำหนดอย่างสุ่ม) ในรอบถัดมา นายจ้างจึงมีข้อมูลสถิติบอกว่า กลุ่มสีเขียวลงทุนในการศึกษามากกว่า เล่นแบบนี้หลาย ๆ รอบ ข้อมูลสถิติมากขึ้นเรื่อย ๆ และเพียงแค่ผ่านไป 20 รอบ โลกแห่งความลำเอียงก็เกิดขึ้น เด็กกลุ่มม่วงเห็นว่ากลุ่มเขียวถูกจ้างมากกว่า ก็ลงทุนในการศึกษาน้อยลง เพราะการลงทุนในการศึกษาไม่ได้เพิ่มโอกาสถูกจ้างมากขึ้นเท่าไร เด็กกลุ่มเขียวอาจพูดว่า "ฉันไม่ลงทุนเพราะยังไงเธอก็ไม่จ้างฉันอยู่ดี" นายจ้างอาจพูดว่า "ฉันไม่จ้างเธอ เพราะเธอไม่ลงทุน" ทั้งหมดนี้เกิดจากความไม่สมมาตรตอนแรก ซึ่งมาจากความบังเอิญล้วน ๆ
อ่านเพลิน สนุก