ขอบเขตเชอร์นอฟ (อังกฤษ: Chernoff bound) ตั้งตามชื่อของ เฮอร์มาน เชอร์นอฟ (Herman Chernoff) ในทฤษฎีความน่าจะเป็น จะเป็นกลุ่มของข้อความทางคณิตศาสตร์ที่ให้ขอบเขตบนของส่วนปลายของการกระจายความน่าจะเป็น ชื่อของอสมการนั้นตั้งเพื่อเป็นเกียรติแก่ เฮอร์แมน เชอร์นอฟ นักคณิตศาสตร์ สถิติ และฟิสิกส์ ชาวอเมริกัน ขอบเขตเชอร์นอฟใช้ข้อมูลจากโมเมนต์ทั้งหมดของตัวแปรสุ่ม ดังนั้นโดยทั่วไปแล้วจึงให้ขอบเขตที่กระชับกว่าอสมการของมาร์คอฟ (ในรูปพื้นฐาน) และอสมการของเชบิเชฟมาก
รูปทั่วไป[แก้]
ให้
เป็นตัวแปรสุ่มใดๆ แล้ว
![{\displaystyle \Pr[X\geq a]\ \leq \ \inf _{t>0}e^{-ta}{\mathcal {M}}_{X}(t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7e2d46c9fbfc97706e5299b17455a9b7a8522b7c)
โดยที่
คือ ฟังก์ชันกำเนิดโมเมนต์ (moment generating function)
การพิสูจน์[แก้]
สำหรับค่าคงที่บวก
ใดๆ
เป็นฟังก์ชันเพิ่มที่มีค่าบวกเสมอ ดังนั้น
ก็ต่อเมื่อ
เมื่อมอง
เป็นตัวแปรสุ่มและใช้อสมการของมาร์คอฟ เราได้ว่า
![{\displaystyle \Pr[X\geq a]=\Pr[e^{tX}\geq e^{ta}]\leq {\frac {\mathrm {E} [e^{tX}]}{e^{ta}}}=e^{-ta}{\mathcal {M}}_{X}(t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7b21801c175b4009ffd19f35bd940a4a9a15248f)
เนื่องจากข้อความข้างต้นเป็นจริงสำหรับทุกๆ จำนวนจริงบวก
มันจึงเป็นจริงสำหรับ
ที่ทำให้
มีค่าต่ำสุดด้วย เพราะฉะนั้น
![{\displaystyle \Pr[X\geq a]\leq \inf _{t>0}e^{-ta}{\mathcal {M}}_{X}(t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/07da93f5baf336d494e56c91d6f234655d7d157a)
ตามต้องการ
ขอบเขตเชอร์นอฟของการทดลองแบบปัวซอง[แก้]
ในส่วนนี้จะกล่าวถึงการหาขอบเขตเชอร์นอฟในกรณีที่ที่ตัวแปรสุ่มอันเป็นผลบวกของการทดลองแบบปัวซองซึ่งเป็นอิสระแก่กัน กรณีพิเศษของขอบเขตเชอร์นอฟแบบนี้ถูกใช้อย่างแพร่หลายในการวิเคราะห์ขั้นตอนวิธีแบบสุ่ม โดยเฉพาะในการพิสูจน์ว่าขั้นตอนวิธีแบบสุ่มหนึ่งๆ จะทำงานได้ดีด้วยความน่าจะเป็นสูง สาเหตุที่ขอบเขตเชอร์นอฟเป็นเทคนิคที่เหมาะสมต่อการวิเคราะห์ขั้นตอนวิธีแบบสุ่มนั้น อาจเพราะว่า โดยทั่วไปเราสามารถมองขั้นตอนวิธีแบบสุ่มว่า เป็นขั้นตอนวิธีที่ใช้การโยนเหรียญที่เป็นอิสระต่อกันหลาย ๆ ครั้งในการตัดสินใจ
ขอบเขตของเชอร์นอฟในกรณีนี้นั้นไม่สมมาตร ดังนั้นในการใช้งานจะมีขอบเขตทั้งของ ส่วนปลายด้านบน ซึ่งจะใช้สำหรับกรณีที่ต้องการหาขอบเขตบนในกรณีที่ตัวแปรสุ่มมีค่ามากกว่าค่าคาดหมาย และ ส่วนปลายด้านล่าง ในกรณีที่พิจารณาเหตุการณ์ที่ตัวแปรสุ่มมีค่าน้อยกว่าค่าคาดหมาย
ใจความ[แก้]
ให้
เป็นจำนวนเต็มบวก และ
สำหรับจำนวน
เป็นการทดลองแบบปัวซองที่เป็นอิสระแก่กันโดยที่
และ
กำหนด
และให้
และ
เป็นจำนวนจริงใดๆ ที่มีค่ามากกว่า 0 แล้ว:
1. (ส่วนปลายด้านบน)
![{\displaystyle \Pr[X>(1+\delta )\mu ]<\left({\frac {e^{\delta }}{(1+\delta )^{1+\delta }}}\right)^{\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4fa645ce0c8d68e6283da4e74ace1c542c5c79fc)
2. (ส่วนปลายด้านล่าง) เมื่อ
![{\displaystyle \Pr[X>(1-\delta )\mu ]<\left({\frac {e^{\delta }}{(1-\delta )^{1-\delta }}}\right)^{\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6588abc81b16cc1e6094931f18a749922bd5941a)
การพิสูจน์[แก้]
เราเริ่มจากการพิสูจน์ส่วนปลายด้านบน จากรูปทั่วไป
![{\displaystyle \Pr[X>(1+\delta )\mu ]<\inf _{t>0}e^{-t(1+\delta )\mu }{\mathcal {M}}_{X}(t)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f0b4a1f26dbd5d0bf698018dbf4614de4b9d283e)
พิจารณา
เราได้ว่า
เนื่องจากตัวแปรสุ่ม
,
,
,
เป็นอิสระแก่กัน เราได้ว่า
![{\displaystyle {\mathcal {M}}_{X}(t)=\mathrm {E} [\prod _{i=1}^{n}e^{tX_{i}}]=\prod _{i=1}^{n}\mathrm {E} [e^{tX_{i}}]=\prod _{i=1}^{n}(p_{i}e^{t}+(1-p_{i}))=\prod _{i=1}^{n}(1+p_{i}(e^{t}-1))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2f5effee9dd76666d5c9ecda09f1310fa32820de)
เพราะว่า
สำหรับจำนวนจริงบวก
ทุกจำนวน เราได้ว่า
![{\displaystyle {\mathcal {M}}_{X}(t)=\prod _{i=1}^{n}(1+p_{i}(e^{t}-1))<\prod _{i=1}^{n}e^{p_{i}(e^{t}-1)}=e^{(e^{t}-1)(p_{1}+\cdots +p_{n})}=e^{(e^{t}-1)\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b98a1793901b5442227357ca4e063e437218f8a0)
เนื่องจาก
ดังนั้น
![{\displaystyle e^{-t(1+\delta )\mu }{\mathcal {M}}_{X}(t)<{\frac {e^{(e^{t}-1)\mu }}{e^{t(1+\delta )\mu }}}=\left({\frac {e^{e^{t}-1}}{e^{t(1+\delta )}}}\right)^{\mu }=(e^{e^{t}-t\delta -t-1})^{\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0e8cb7c220f460976735cc5d2bfe38066bb3f112)
กำหนดฟังก์ชัน
เราได้ว่า
และ
สมมติให้
เราได้ว่า
และ
เพราะฉะนั้น
จึงมีค่าต่ำสุดสัมบูรณ์ที่
เราจึงได้ว่า
![{\displaystyle \Pr[X>(1+\delta )\mu ]<\inf _{t>0}e^{-t(1+\delta )\mu }{\mathcal {M}}_{X}(t)<\inf _{t>0}f(t)^{\mu }=f(\ln(1+\delta ))^{\mu }=\left({\frac {e^{\delta }}{(1+\delta )^{1+\delta }}}\right)^{\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0f9cf30ddf15e8a99176ab30f9cfb60d9b43d85d)
ตามต้องการ
สำหรับส่วนปลายด้านล่างนั้น เราเริ่มจากสังเกตว่า
ก็ต่อเมื่อ
เมื่อใช้รูปทั่วไปของขอบเขตเชอร์นอฟ ได้ว่า
![{\displaystyle \Pr[X<(1-\delta )\mu ]<\inf _{t>0}e^{(1-\delta )\mu }\mathrm {E} [e^{-tX}]}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ded21297c6daf6baf62e4f8d3eb64c87f592b90d)
เมื่อใช้การให้เหตุผลแบบเดียวกับการพิสูจน์ส่วนปลายด้านบน เราได้ว่า
![{\displaystyle \Pr[X<(1-\delta )\mu ]<\inf _{t>0}\left({\frac {e^{e^{-t}-1}}{e^{-t(1-\delta )}}}\right)^{\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/aff987304ac8a6772d4643802137fff9dac7d6cd)
ค่าต่ำสุดของฟังก์ชันทางด้านขวามือของอสมการอยู่ที่
ฉะนั้น
![{\displaystyle \Pr[X<(1-\delta )\mu ]<\left({\frac {e^{\delta }}{(1-\delta )^{1-\delta }}}\right)^{\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9393ce8706ac270ffbc19bc0e17d09d640005c1d)
ตามต้องการ
รูปแบบอื่น ๆ[แก้]
รูปแบบทั้งสองข้างต้นเป็นรูปแบบที่ให้ขอบเขตที่แน่นที่สุดของขอบเขตเชอร์นอฟ อย่างไรก็ตาม รูปแบบทั้งสามแบบด้านล่างที่อาจมีเงื่อนไขเพิ่มเติม มักนำไปใช้ได้สะดวกกว่า
1. (ส่วนปลายด้านบน) ถ้า
![{\displaystyle \Pr[X>(1+\delta )\mu ]<e^{-\mu \delta ^{2}/4}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1e65fa89ca1750e94e37d28b1e172a05110a7cea)
และ สำหรับ
![{\displaystyle \Pr[X>(1+\delta )\mu ]<2^{-(1+\delta )\mu }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f13576f6c1642bd004024b99ccb1abaafd408349)
2. (ส่วนปลายด้านล่าง) ถ้า
![{\displaystyle \Pr[X<(1-\delta )\mu ]<e^{-\mu \delta ^{2}/2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/14962b86e0cfa4c173a76301ad753b513485d13c)