กฎของเบนฟอร์ด
กฎของเบนฟอร์ด (อังกฤษ: Benford's law) หรือ กฎเลขโดดตัวแรก หมายถึง ความถี่การกระจายเลขโดดในหลายแหล่งข้อมูลในชีวิตจริง (แต่ไม่ใช่ทั้งหมด) ในการกระจายนี้ ปรากฏว่าเลข 1 เป็นเลขหลักแรกมากถึงราว 30% ของทั้งหมด ขณะที่เลขมากกว่า 1 มีความถี่เป็นเลขหลักแรกน้อยกว่า โดยเลข 9 เป็นเลขหลักแรกน้อยกว่า 5% ของทั้งหมด กฎของเบนฟอร์ดยังว่าด้วยการกระจายคาดหมายของเลขโดดหลักอื่นด้วย ซึ่งมาใกล้การกระจายเป็นรูปแบบเดียวกัน
พบว่าผลลัพธ์นี้ใช้ได้กับชุดข้อมูลหลากหลาย รวมถึงใบแจ้งหนี้ไฟฟ้า ที่อยู่ถนน ราคาหลักทรัพย์ จำนวนประชากร อัตราตาย ความยาวแม่น้ำ ค่าคงตัวทางฟิสิกส์และคณิตศาสตร์ และกระบวนการซึ่งอธิบายด้วยกฎเลขยกกำลัง ซึ่งพบได้บ่อย กฎของเบนฟอร์ดมีแนวโน้มแม่นยำที่สุดเมื่อค่ามีการกระจายตัวที่หลากหลายอันดับของขนาด
กราฟที่แสดงขวามือแสดงกฎของเบนฟอร์ดสำหรับฐาน 10 มีนัยทั่วไปของกฎต่อจำนวนที่แสดงในฐานอื่น (เช่น ฐาน 16) และยังมีนัยทั่วไปตั้งแต่เลขโดดหลักแรกจนถึงเลขโดด n หลักแรก
กฎนี้ได้ชื่อตามนักฟิสิกส์ แฟรงก์ เบนฟอร์ด ซึ่งระบุใน ค.ศ. 1938[1] แม้ไซมอน นิวคอมบ์จะเคยระบุไว้ก่อนแล้วใน ค.ศ. 1881[2]
นิยาม
[แก้]เซตของจำนวน เรียกว่าเป็นไปตามกฎของเบนฟอร์ด เมื่อหลักแรกสุด d มีการกระจายตามสูตรความน่าจะเป็น
ซึ่งคิดเป็นตัวเลขได้เป็น:
ขนาดสัมพัทธ์ของ | ||
---|---|---|
1 | 30.1% | |
2 | 17.6% | |
3 | 12.5% | |
4 | 9.7% | |
5 | 7.9% | |
6 | 6.7% | |
7 | 5.8% | |
8 | 5.1% | |
9 | 4.6% |
จากสูตรแสดงว่า โอกาส P(d) แปรผันตรงกับพื้นที่ระหว่าง d กับ d + 1 บนสเกลลอการิทึม ซึ่งตรงกับการที่ลอการิทึมของจำนวนมีการแจกแจงเอกรูป
ตัวอย่างเช่น จำนวน x ใด ๆ ที่ 1≤ x < 10 จะขี้นต้นด้วย 1 ถ้า 1 ≤ x < 2 และขึ้นต้นด้วย 9 ถ้า 9 ≤ x < 10 แต่จากการแจกแจงเอกรูปของลอการิทึม เราจึงคำนึงจากการที่ x ขี้นต้นด้วย 1 ถ้า log 1 ≤ log x < log 2 และขึ้นต้นด้วย 9 ถ้า log 9 ≤ log x < log 10 ซึ่งช่วง [log 1, log 2] มีขนาดกว้างกว่า [log 9, log 10] มาก (0.301 กับ 0.046 ตามลำดับ) จึงมีโอกาสสูงกว่าที่ x จะขึ้นต้นด้วย 1
กฎของเบนฟอร์ดในฐานอื่น ๆ
[แก้]สูตรกฎของเบนฟอร์ดข้างต้น สามารถใช้ในฐาน b ≥ 2 ใด ๆ ได้โดยปรับลอการิทึมให้เป็นฐาน b เป็นสูตรทั่วไปว่า
ในกรณีฐานสอง กฎของเบนฟอร์ดกล่าวว่าทุกจำนวน (นอกจาก 0) ขึ้นต้นด้วย 1 ซึ่งเป็นจริงอย่างเห็นชัด
กฎของเบนฟอร์ดสำหรับหลักนอกเหนือจากหลักแรก
[แก้]กฎของเบนฟอร์ดสามารถใช้กับหลักแรกมากกว่าหนึ่งหลัก[3] โดยโอกาสที่จำนวนจะขึ้นด้วยเลขหลายหลัก n คือ
เช่น โอกาสที่จำนวนจะขึ้นต้นด้วย 314 คือ
จากสูตรนี้ สามารถหาความน่าจะเป็นของเลขโดดในตำแหน่งที่ไม่ใช่หลักแรกได้ เช่น โอกาสที่จำนวนใด ๆ จะมี 3 อยู่ในตำแหน่งที่สอง เท่ากับโอกาสที่จำนวนนั้นจะขึ้นต้นด้วยจำนวนใด ๆ ใน {13, 23, ...93} เท่ากับ
ในทำนองเดียวกัน โอกาสที่ d (d = 0, 1, 2, ...9) จะอยู้ในตำแหน่งที่ n เท่ากับ
ซึ่งเมื่อ n เพิ่มขึ้นการแจกแจงนี้จะขยับเข้าหาการแจกแจงเอกรูปอย่างรวดเร็วดังตาราง[4]
เลขโดด | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
ตำแหน่งที่ 1 | N/A | 30.1% | 17.6% | 12.5% | 9.7% | 7.9% | 6.7% | 5.8% | 5.1% | 4.6% |
ตำแหน่งที่ 2 | 12% | 11.4% | 10.9% | 10.4% | 10% | 9.7% | 9.3% | 9% | 8.8% | 8.5% |
ตำแหน่งที่ 3 | 10.2% | 10.1% | 10.1% | 10.1% | 10% | 10% | 9.9% | 9.9% | 9.9% | 9.8% |
อ้างอิง
[แก้]- ↑ Frank Benford (March 1938). "The law of anomalous numbers". Proceedings of the American Philosophical Society. 78 (4): 551–572. JSTOR 984802. (subscription required)
- ↑ Simon Newcomb (1881). "Note on the frequency of use of the different digits in natural numbers". American Journal of Mathematics. American Journal of Mathematics, Vol. 4, No. 1. 4 (1/4): 39–40. doi:10.2307/2369148. JSTOR 2369148. (subscription required)
- ↑ Theodore P. Hill, "The Significant-Digit Phenomenon", The American Mathematical Monthly, Vol. 102, No. 4, (Apr., 1995), pp. 322–327. Official web link (subscription required). Alternate, free web link.
- ↑ Theodore P. Hill, "The Significant-Digit Phenomenon", The American Mathematical Monthly, Vol. 102, No. 4, (Apr., 1995), pp. 322–327. Official web link (subscription required). Alternate, free web link.