แอลฟาโกะ
แอลฟาโกะ (อังกฤษ: AlphaGo) เป็นโปรแกรมคอมพิวเตอร์ที่เล่นเกมกระดานหมากล้อม[1] ที่ได้รับการพัฒนาโดย กูเกิล ดีปไมด์ ของ แอลฟาเบต อิงก์ ในกรุงลอนดอน แอลฟาโกะมีรุ่นสืบทอดที่มีอานุภาพมากกว่าถึงสามรุ่น ได้แก่ แอลฟาโกะ มาสเตอร์, แอลฟาโกะ ซีโร[2] และ แอลฟาซีโร
ในเดือนตุลาคม ค.ศ. 2015 แอลฟาโกะกลายเป็นโปรแกรมคอมพิวเตอร์โกะตัวแรกที่ชนะนักหมากล้อมอาชีพโดยไม่มีแต้มต่อบนกระดานขนาด 19 × 19 เต็มรูปแบบ[3][4] ในเดือนมีนาคม ค.ศ. 2016 มันสามารถเป็นฝ่ายชนะอี เซ-ดล ในการแข่งขันห้าเกม ซึ่งเป็นครั้งแรกที่โปรแกรมคอมพิวเตอร์โกะสามารถเป็นฝ่ายชนะมืออาชีพระดับ 9 ดั้งโดยไม่มีแต้มต่อ[5] แม้ว่าจะเป็นฝ่ายแพ้อี เซ-ดล ในเกมที่สี่ แต่อีก็ยอมแพ้ในเกมสุดท้าย ส่งผลให้แอลฟาโกะเป็นฝ่ายชนะด้วยผล 4 ต่อ 1 ในการยอมรับถึงชัยชนะ แอลฟาโกะได้รับรางวัล 9 ดั้งกิตติมศักดิ์จากสมาคมหมากล้อมแห่งประเทศเกาหลี[6] รายการดังกล่าวและนัดท้าชิงกับอี เซ-ดล ได้รับการบันทึกไว้ในภาพยนตร์สารคดีที่มีชื่อเดียวกันว่า แอลฟาโกะ[7] กำกับโดยเกร็ก โคหส์ ผลงานนี้ได้รับเลือกจากวารสารไซเอินซ์ในตำแหน่งรองชนะเลิศของความก้าวหน้าแห่งปี ในวันที่ 22 ธันวาคม ค.ศ. 2016[8]
ที่การประชุมสุดยอดหมากล้อมแห่งอนาคต ค.ศ. 2017 แอลฟาโกะเป็นฝ่ายชนะเคอ เจี๋ย ซึ่งเป็นผู้เล่นอันดับ 1 ของโลกในเวลานั้น ในการแข่งขันสามเกม หลังจากนั้น แอลฟาโกะได้รับรางวัล 9 ดั้งระดับมืออาชีพจากสมาคมหมากล้อมแห่งประเทศจีน[9]
แอลฟาโกะใช้ขั้นตอนวิธีคำนวณแบบการค้นหาต้นไม้มงเต การ์โล เพื่อหาตาเดินของมันโดยขึ้นอยู่กับความรู้ที่ได้ "เรียนรู้" ก่อนหน้านี้โดยการเรียนรู้ของเครื่อง โดยเฉพาะโครงข่ายประสาทเทียม (กระบวนการการเรียนรู้เชิงลึก) โดยการฝึกฝนที่ครอบคลุมแบบถ้วนทั่ว ทั้งจากการเล่นของมนุษย์และคอมพิวเตอร์[10] โครงข่ายประสาทได้รับการฝึกเพื่อคาดการณ์การเลือกเดินของตัวแอลฟาโกะเองและเป็นฝ่ายชนะเกม โครงข่ายประสาทนี้ช่วยเพิ่มพลังของการคำนวณแบบการค้นหาต้นไม้ ส่งผลให้มีการเลือกเดินมีคุณภาพสูงขึ้น และการเล่นด้วยตัวเองที่แข็งแกร่งขึ้นในการทำซ้ำครั้งต่อไป
หลังจากการแข่งขันระหว่างแอลฟาโกะกับเคอ เจี๋ย แอลฟาโกะได้อำลาวงการในขณะที่ดีปไมด์ดำเนินการวิจัยเอไอในด้านอื่น ๆ ต่อไป[11] การเริ่มต้นจาก 'หน้าว่าง' ด้วยระยะเวลาการฝึกสั้น ๆ เท่านั้น ยังทำให้แอลฟาโกะ ซีโร ประสบความสำเร็จ 100–0 เกม จากการเป็นฝ่ายชนะชนะแชมป์อย่างแอลฟาโกะ ในขณะที่รุ่นสืบทอดอย่างแอลฟาซีโร ซึ่งทำการสอนด้วยตัวเอง ก็ยังได้รับการยอมรับในฐานะมืออันดับต้น ๆ ของโลก ทั้งในหมากล้อมและอาจรวมถึงในหมากรุกสากล
ประวัติ
[แก้]หมากล้อมได้รับการพิจารณาว่ายากมากสำหรับคอมพิวเตอร์ที่จะเป็นฝ่ายชนะกว่าเกมอื่น ๆ เช่นหมากรุก เนื่องจากจำนวนการแตกกิ่งก้านที่มีขนาดใหญ่มากจึงทำให้ยากที่จะใช้วิธีการดั้งเดิมของเอไอ เช่น การตัดออกแบบแอลฟา–เบตา, การท่องต้นไม้ และการค้นหาวิทยาการศึกษาสำนึก[3][12]
เกือบสองทศวรรษหลังจากที่ดีปบลูคอมพิวเตอร์ของไอบีเอ็มชนะแชมป์หมากรุกโลกอย่างแกรี คาสปารอฟ ในดีปบลูพบคาสปารอฟ โปรแกรมหมากล้อมที่แข็งแกร่งใช้เทคนิคปัญญาประดิษฐ์ถึงระดับ 5 ดั้งสมัครเล่นเท่านั้น[10] และยังไม่สามารถเอาชนะผู้เล่นหมากล้อมระดับอาชีพได้โดยไม่มีแต้มต่อ[3][4][13] ส่วนในปี ค.ศ. 2012 โปรแกรมซอฟต์แวร์เซน ได้ทำงานบนคอมพิวเตอร์สี่กลุ่ม และเป็นฝ่ายชนะมาซากิ ทาเกมิยะ (9 ดั้งอาชีพ) สองครั้งด้วยแต้มต่อห้าและสี่เม็ด[14] ครั้นในปี ค.ศ. 2013 ซอฟต์แวร์เครซีสโตน เป็นฝ่ายชนะโยชิโอะ อิชิดะ (9 ดั้งอาชีพ) ด้วยแต้มต่อสี่เม็ด[15]
อ้างอิงจากเดวิด ซิลเวอร์ ของดีปไมด์ โครงการวิจัยแอลฟาโกะก่อตั้งขึ้นประมาณปี ค.ศ. 2014 เพื่อทดสอบเครือข่ายประสาทเทียมที่ใช้การเรียนรู้เชิงลึกสามารถเข้าแข่งขันในหมากล้อมได้[16] แอลฟาโกะแสดงถึงการปรับปรุงที่สำคัญกว่าโปรแกรมหมากล้อมรุ่นก่อน โดยใน 500 เกมได้เผชิญกับโปรแกรมหมากล้อมอื่น ๆ ที่มีอยู่ รวมทั้งเครซีสโตนและเซน[17] แอลฟาโกะที่ทำงานบนคอมพิวเตอร์เครื่องเดียวได้เป็นฝ่ายชนะทุกเกมยกเว้นเพียงเกมเดียว[18] ในการจับคู่ที่คล้ายกัน แอลฟาโกะทำงานบนคอมพิวเตอร์หลายเครื่องได้ชนะเกมทั้งหมด 500 เกมที่เล่นกับโปรแกรมหมากล้อมอื่น ๆ และ 77 เปอร์เซนต์ของเกมที่เล่นกับแอลฟาโกะทำงานบนคอมพิวเตอร์เครื่องเดียว เวอร์ชันเผยแพร่ในเดือนตุลาคม ค.ศ. 2015 ใช้ 1,202 หน่วยประมวลผลกลาง และ 176 หน่วยประมวลผลกราฟิกส์[10]
แมตช์ปะทะฝาน ฮุย
[แก้]ในเดือนตุลาคม ค.ศ. 2015 รุ่นเผยแพร่ของแอลฟาโกะชนะแชมป์หมากล้อมของยุโรปอย่างฝาน ฮุย[19] ซึ่งเป็นนักหมากล้อมอาชีพระดับ 2 ดั้ง (จากที่มีทั้งหมด 9 ดั้ง) ห้าต่อศูนย์เกม[4][20] นี่เป็นครั้งแรกที่โปรแกรมหมากล้อมคอมพิวเตอร์เป็นฝ่ายชนะผู้เล่นระดับอาชีพบนกระดานขนาดเต็มโดยไม่มีแต้มต่อ[21] การประกาศข่าวดังกล่าวล่าช้าไปจนถึงวันที่ 27 มกราคม ค.ศ. 2016 เพื่อให้ตรงกับการตีพิมพ์บทความในวารสารเนเจอร์[10] โดยมีการอธิบายถึงการใช้อัลกอริทึม[4]
แมตช์ปะทะอี เซ-ดล
[แก้]แอลฟาโกะได้เล่นกับอี เซ-ดล ซึ่งเป็นนักหมากล้อมระดับอาชีพ 9 ดั้งชาวเกาหลีใต้ หนึ่งในผู้เล่นที่ดีที่สุดในหมากล้อม[13] กับห้าเกมที่จัดที่โรงแรมโฟร์ซีซันส์ในกรุงโซล ประเทศเกาหลีใต้เมื่อวันที่ 9, 10, 12, 13 และ 15 มีนาคม ค.ศ. 2016[22][23] ซึ่งมีวิดีโอสตรีมถ่ายทอดสด[24] ส่วนเอจา ฮวง ซึ่งเป็นสมาชิกทีมดีปไมด์ และนักเล่นหมากล้อม 6 ดั้งสมัครเล่น ได้วางเม็ดบนกระดานหมากล้อมให้แก่แอลฟาโกะ ซึ่งทำงานผ่านระบบคลาวด์ของกูเกิลพร้อมกับเซิร์ฟเวอร์ที่ตั้งอยู่ในสหรัฐ[25] การแข่งขันใช้กติกาแบบจีนกับโคมิ 7.5 แต้ม และแต่ละฝ่ายมีเวลาในการคิดสองชั่วโมงบวกกับระยะเวลาเบียวโยมิ 60 วินาที[26] เวอร์ชันของแอลฟาโกะที่เล่นกับอีใช้จำนวนกำลังประมวลผลเหมือนกับที่ใช้ในการแข่งขันกับฝาน ฮุย[27] นิตยสารดิอีโคโนมิสต์รายงานว่าใช้ 1,920 หน่วยประมวลผลกลาง และ 280 หน่วยประมวลผลกราฟิกส์[28]
ในขณะที่เล่น อี เซ-ดล มีชัยชนะหมากล้อมชิงแชมป์ระหว่างประเทศสูงสุดเป็นอันดับ 2 ของโลก[29] แม้ว่าจะไม่มีวิธีการอย่างเป็นทางการในการจัดอันดับหมากล้อมระดับนานาชาติ แต่แหล่งข่าวบางแห่งได้ให้อี เซ-ดล เป็นผู้เล่นที่ดีที่สุดอันดับที่สี่ในโลกในขณะนั้น[30][31] ส่วนแอลฟาโกะไม่ได้รับการฝึกโดยเฉพาะเพื่อเผชิญหน้ากับอี[32]
แอลฟาโกะเป็นฝ่ายชนะสามเกมแรกตามการยอมจำนนของอี[33][34] อย่างไรก็ตาม อีเป็นฝ่ายชนะแอลฟาโกะในเกมที่สี่ ที่ชนะจากฝ่ายตรงข้ามยอมจำนนในตาที่ 180 จากนั้น แอลฟาโกะยังคงชนะได้เป็นครั้งที่สี่ จากการชนะเกมที่ห้าโดยอีกฝ่ายยอมจำนน[35]
รางวัลนี้มีมูลค่า 1 ล้านดอลลาร์สหรัฐ เนื่องด้วยแอลฟาโกะเป็นฝ่ายชนะสี่ในห้าเกม และดังนั้น รางวัลจะนำไปมอบให้แก่องค์กรการกุศล รวมทั้งยูนิเซฟ ส่วนอี เซ-ดล ได้รับเงิน 150,000 ดอลลาร์สำหรับการเข้าร่วมในเกมทั้งหมดห้าเกมและเพิ่มอีก 20,000 ดอลลาร์สำหรับการชนะของเขา[26]
ในเดือนมิถุนายน ค.ศ. 2016 ในการนำเสนอที่จัดขึ้นที่มหาวิทยาลัยในประเทศเนเธอร์แลนด์ เอจา ฮวง หนึ่งในทีมดีปไมด์ เปิดเผยว่าได้แก้ไขปัญหาที่เกิดขึ้นในระหว่างเกมที่ 4 ระหว่างแอลฟาโกะกับอี และหลังจากตาเดินที่ 78 (ซึ่งได้รับการขนานนามว่า "การเคลื่อนย้ายของพระเจ้า" โดยระดับอาชีพหลายคน) มันจะเล่นได้อย่างแม่นยำและรักษาความได้เปรียบของหมากดำ ก่อนถึงตาเดินที่ 78 แอลฟาโกะเป็นผู้นำตลอดเกมและการเดินของอีไม่ได้รับการยกย่องว่าเป็นหนึ่งในเกมที่ชนะ แต่เกิดจากพลังการประมวลผลของโปรแกรมถูกเบี่ยงเบนและสับสน[36] ฮวงอธิบายว่าเครือข่ายวิถีทางของแอลฟาโกะของการหาคำสั่งเดินที่แม่นยำที่สุดและความต่อเนื่อง ไม่ได้นำแอลฟาโกะไปสู่ความต่อเนื่องที่ถูกต้องหลังจากตาเดินที่ 78 เนื่องจากเครือข่ายประเมินค่าไม่ได้ระบุว่าตาเดินที่ 78 ของอีจะเป็นไปได้มากที่สุด และดังนั้นเมื่อเดินตาดังกล่าว ทำให้แอลฟาโกะไม่สามารถปรับให้ถูกต้องเพื่อความต่อเนื่องทางตรรกะได้[37]
หกสิบเกมออนไลน์
[แก้]เมื่อวันที่ 29 ธันวาคม ค.ศ. 2016 บัญชีใหม่บนเซิร์ฟเวอร์ทาอีเจ็มชื่อ "มาจิสเตอร์" (Magister) (ซึ่งแสดงเป็น 'มาจิสต์' (Magist) ในเวอร์ชันภาษาจีนของเซิร์ฟเวอร์) จากประเทศเกาหลีใต้ได้เริ่มเล่นเกมกับนักกีฬามืออาชีพ จากนั้นได้เปลี่ยนชื่อบัญชีเป็น "มาสเตอร์" (Master) ในวันที่ 30 ธันวาคม แล้วย้ายไปที่เซิร์ฟเวอร์ฟอกซ์โกะในวันที่ 1 มกราคม ค.ศ. 2017 ครั้นเมื่อวันที่ 4 มกราคม ทางดีปไมด์ได้ยืนยันว่าทั้ง "มาจิสเตอร์" และ "มาสเตอร์" เป็นการเล่นโดยแอลฟาโกะในเวอร์ชันที่อัปเดตแล้ว[38][39] ณ วันที่ 5 มกราคม ค.ศ. 2017 สถิติออนไลน์ของแอลฟาโกะคือแพ้ 60 ครั้งและแพ้ 0 ครั้ง[40] รวมถึงสามชัยชนะเหนือผู้เล่นอันดับหนึ่งของหมากล้อมอย่างเคอ เจี๋ย[41] ที่ได้รับการบรรยายสรุปอย่างเงียบ ๆ ล่วงหน้าว่ามาสเตอร์เป็นเวอร์ชันหนึ่งของแอลฟาโกะ[40] หลังจากแพ้ต่อมาสเตอร์ กู่ ลี่ เสนอเงินรางวัล 100,000 หยวน (14,400 ดอลลาร์สหรัฐ) ให้แก่ผู้เล่นคนแรกที่สามารถเอาชนะมาสเตอร์ได้[39] มาสเตอร์เล่นที่ 10 เกมต่อวัน หลายคนสงสัยอย่างรวดเร็วว่าเป็นผู้เล่นเอไอเนื่องจากมีการพักระหว่างเกมน้อยหรือไม่มีเลย คู่ต่อสู้ของมันรวมถึงแชมป์โลกหลายราย เช่น เคอ เจี๋ย, พัก จ็อง-ฮวัน, ยูตะ อิยามะ, ตั้ว เจียซี, หมี่ ยวี่ถิง, สือ เยวี่ย, เฉิน เย่าเย่, หลี่ ชินเฉิง, กู่ ลี่, ฉาง เฮ่า, ถัง เหวยซิง, ฟั่น ถิงอี้ว์, โจว รุ่ยหยาง, เจียง เหวยเจี๋ย, โจว จุ้น-ซุน, คิม จี-ซ็อก, คัง ทง-ยุน, พัก ย็อง-ฮุน และว็อน ซ็อง-จิน; แชมป์ของประเทศหรือรองแชมป์โลก เช่น เหลียน เซี่ยว, ถัน เซี่ยว, เม่ง ไท่หลิง, ตั่ง อี้เฟย, หวง หยุนซง, หยาง ติ่งซิน, กู จื่อเหา, ชิน จินซอ, โช ฮัน-ซึง และอัน ซ็องจุน เกมทั้งหมด 60 เกมยกเว้นหนึ่งเกมเป็นเกมเร็ว กับสามเกมแบบเบียวโยมิ 20 หรือ 30 วินาที มาสเตอร์ได้เสนอให้ขยายเบียวโยมิไปหนึ่งนาทีเมื่อเล่นกับเนี่ย เว่ยผิง ในการพิจารณาจากอายุของเขา หลังจากชนะเกมที่ 59 มาสเตอร์ได้เปิดเผยตัวเองในแชทรูมที่ได้รับการควบคุมโดย ดร. เอจา ฮวง จากทีมดีปไมด์[42] แล้วเปลี่ยนสัญชาติของมันเป็นสหราชอาณาจักร หลังจากเกมเหล่านี้เสร็จสิ้น เดมิส ฮัสซาบิส ซึ่งเป็นผู้ร่วมก่อตั้งกูเกิล ดีปไมด์ ได้กล่าวในทวีตว่า "เรากำลังรอคอยที่จะเล่นเกมอย่างเป็นทางการและเต็มรูปแบบในเวลาต่อมา [ค.ศ. 2017] โดยร่วมมือกับองค์กรหมากล้อมและผู้เชี่ยวชาญ"[38][39]
ผู้เชี่ยวชาญด้านหมากล้อมรู้สึกประทับใจกับประสิทธิภาพการทำงานของแอลฟาโกะ และสไตล์การเล่นที่ไม่ได้เป็นมนุษย์ เคอ เจี๋ย กล่าวว่า "หลังจากที่มนุษยชาติใช้เวลาหลายพันปีในการปรับปรุงกลยุทธ์ของเรา คอมพิวเตอร์บอกเราว่ามนุษย์เป็นฝ่ายผิดอย่างสิ้นเชิง... ผมจะส่งเสียงเท่าที่จะบอกได้ว่าไม่ใช่มนุษย์คนเดียวที่ได้สัมผัสกับขอบแห่งความจริงของหมากล้อม"[40]
การประชุมสุดยอดหมากล้อมแห่งอนาคต
[แก้]ในการประชุมสุดยอดหมากล้อมแห่งอนาคต ซึ่งจัดขึ้นที่อูเจิ้นในเดือนพฤษภาคม ค.ศ. 2017 แอลฟาโกะได้เล่นสามเกมกับเคอ เจี๋ย ซึ่งเป็นนักหมากล้อมอันดับ 1 ของโลก รวมทั้งสองเกมกับมืออาชีพจีนชั้นนำหลายคน ได้แก่ เกมหมากล้อมแบบจับคู่หนึ่งเกม และที่พบกับทีมห้าผู้เล่นที่เป็นมนุษย์อีกหนึ่งเกม[43]
กูเกิล ดีปไมด์ มอบรางวัล 1.5 ล้านดอลลาร์เป็นรางวัลแก่ผู้ชนะสำหรับการจับคู่สามเกมระหว่างเคอ เจี๋ย และแอลฟาโกะ ขณะที่ฝ่ายแพ้ได้รับเงิน 300,000 ดอลลาร์[44][45][46] ซึ่งแอลฟาโกะชนะทั้งสามเกมกับเคอ เจี๋ย[47][48] รวมทั้งแอลฟาโกะได้รับรางวัล 9 ดั้งระดับมืออาชีพจากสมาคมหมากล้อมแห่งประเทศจีน[9]
หลังจากที่ชนะการแข่งขันสามเกมกับเคอ เจี๋ย ผู้เป็นนักหมากล้อมอันดับสูงสุด แอลฟาโกะก็ได้อำลาวงการ และทางดีปไมด์ยังยกเลิกการทำงานของทีมที่ทำงานเกี่ยวกับเกมเพื่อมุ่งเน้นไปที่การวิจัยเอไอในด้านอื่น ๆ ต่อไป[11] หลังจากการประชุมสุดยอด ดีปไมด์ได้เผยแพร่แมตช์แอลฟาโกะปะทะแอลฟาโกะ 50 เกมเต็มความยาว เป็นของขวัญให้แก่ชุมชนหมากล้อม[49]
แอลฟาโกะ ซีโร และแอลฟาซีโร
[แก้]ทีมแอลฟาโกะเผยแพร่บทความในวารสารเนเจอร์ เมื่อวันที่ 19 ตุลาคม ค.ศ. 2017 โดยแนะนำแอลฟาโกะ ซีโร ซึ่งเป็นเวอร์ชันที่ไม่มีข้อมูลของมนุษย์และแข็งแกร่งกว่าเวอร์ชันก่อน ๆ ของมนุษย์ที่ชนะการแข่งขัน[50] โดยการเล่นเกมกับตัวเอง แอลฟาโกะ ซีโร เหนือกว่าจุดแข็งของแอลฟาโกะ อี ภายในสามวันด้วยการชนะ 100 เกมต่อ 0 อีกทั้งถึงระดับของแอลฟาโกะ มาสเตอร์ ภายใน 21 วัน และเหนือกว่ารุ่นเก่าทั้งหมดใน 40 วัน[51]
ในเอกสารที่เผยแพร่ในอาร์ซิฟเมื่อวันที่ 5 ธันวาคม ค.ศ. 2017 ดีปไมด์อ้างว่ามันใช้แนวทางแอลฟาโกะ ซีโร โดยทั่วไปจนกลายเป็นแอลฟาซีโรอัลกอริทึมเดียว ซึ่งประสบความสำเร็จภายใน 24 ชั่วโมงในระดับที่เหนือกว่าของการเล่นในเกมหมากรุกสากล, หมากรุกญี่ปุ่น และหมากล้อม โดยการเอาชนะโปรแกรมแชมป์โลก ทั้งสต็อกฟิช, เอลโม และแอลฟาโกะ ซีโร เวอร์ชัน 3 วัน[52]
แกรนด์มาสเตอร์ ฮิการุ นากามูระ รู้สึกประทับใจเล็กน้อยในการชนะหมากรุกสากลของแอลฟาซีโร โดยกล่าวว่า "ความเข้าใจของผมคือแอลฟาซีโรนั้นใช้ซูเปอร์คอมพิวเตอร์ของกูเกิล และสต็อกฟิชไม่ทำงานบนฮาร์ดแวร์นั่น สต็อกฟิชนั้นทำงานบนแล็ปท็อปของผม หากคุณต้องการมีการแข่งขันที่เทียบเคียงคุณต้องมีสต็อกฟิชทำงานบนซูเปอร์คอมพิวเตอร์เช่นกัน"[53] ผู้เล่นหมากรุกสากลระดับแถวหน้าของสหรัฐอย่างโวล์ฟ มอร์โรว์ ก็รู้สึกไม่ประทับใจเช่นกัน โดยอ้างว่าแอลฟาซีโรอาจจะไม่ทำให้รอบรองชนะเลิศของการแข่งขันที่เป็นธรรมเหมือนกับทีซีอีซีที่เอนจินทั้งหมดเล่นบนฮาร์ดแวร์ที่เท่าเทียมกัน มอร์โรว์กล่าวเพิ่มเติมว่าแม้ว่าเขาอาจจะไม่สามารถเอาชนะแอลฟาซีโรได้หากแอลฟาซีโรเล่นเปืดเกมเช่นการป้องกันของเปตรอฟ ซึ่งแอลฟาซีโรจะไม่สามารถเอาชนะเขาได้ในเกมหมากรุกทางจดหมายเช่นกัน[54]
เครื่องมือการสอน
[แก้]เมื่อวันที่ 11 ธันวาคม ค.ศ. 2017 ดีปไมด์ได้เปิดตัวเครื่องมือการสอนแอลฟาโกะในเว็บไซต์ของตน[55] เพื่อวิเคราะห์อัตราการชนะของการเปิดหมากล้อมที่แตกต่างกันตามที่แอลฟาโกะ มาสเตอร์ คำนวณ[56] เครื่องมือการสอนรวบรวม 6,000 การเปิดหมากล้อมจาก 230,000 เกมของมนุษย์ในแต่ละเกมที่วิเคราะห์ด้วย 10,000,000 แบบจำลองโดยแอลฟาโกะ มาสเตอร์ หลายการเปิดประกอบด้วยการแนะนำการดำเนินเกมของมนุษย์[56]
เวอร์ชัน
[แก้]แอลฟาโกะเวอร์ชันก่อน ๆ ได้รับการทดสอบเกี่ยวกับฮาร์ดแวร์ที่มีซีพียูและจีพียูหลายแบบ โดยทำงานในแบบอะซิงโครนัสหรือโหมดแบบกระจาย สองวินาทีของการคิดในการเดินแต่ละตา ผลการให้คะแนนอีโลแสดงที่รายการด้านล่าง[10] โดยในการแข่งขันที่มีเวลาต่อการเดินมากขึ้นระดับการให้คะแนนเมื่อชนะก็จะมากขึ้น
โครงแบบ | กระบวนการทำงาน ค้นหา |
จำนวนของซีพียู | จำนวนของจีพียู | การให้คะแนนอีโล |
---|---|---|---|---|
แบบเดี่ยว[10] พี. 10–11 | 40 | 48 | 1 | 2,181 |
แบบเดี่ยว | 40 | 48 | 2 | 2,738 |
แบบเดี่ยว | 40 | 48 | 4 | 2,850 |
แบบเดี่ยว | 40 | 48 | 8 | 2,890 |
แบบกระจาย | 12 | 428 | 64 | 2,937 |
แบบกระจาย | 24 | 764 | 112 | 3,079 |
แบบกระจาย | 40 | 1,202 | 176 | 3,140 |
แบบกระจาย | 64 | 1,920 | 280 | 3,168 |
ในเดือนพฤษภาคม ค.ศ. 2016 กูเกิลได้เปิดตัว "หน่วยประมวลผลเทนเซอร์" ซึ่งเป็นฮาร์ดแวร์ที่เป็นกรรมสิทธิ์ของตนเอง ซึ่งระบุว่าได้รับการติดตั้งในโครงการภายในหลายแห่งที่กูเกิลแล้ว รวมทั้งการแข่งขันแอลฟาโกะกับอี เซ-ดล[57][58]
ในการประชุมสุดยอดหมากล้อมแห่งอนาคตเมื่อเดือนพฤษภาคม ค.ศ. 2017 ดีปไมด์เผยว่าเวอร์ชันของแอลฟาโกะที่ใช้ในการประชุมสุดยอดครั้งนี้คือแอลฟาโกะ มาสเตอร์[59][60] และเปิดเผยว่าได้วัดความแรงของซอฟต์แวร์เวอร์ชันต่าง ๆ ส่วนแอลฟาโกะ อี ซึ่งเป็นเวอร์ชันที่ใช้กับอี สามารถต่อให้แอลฟาโกะ ฝาน ซึ่งเป็นเวอร์ชันที่ใช้กับฝาน ฮุย ด้วยแต้มต่อสามเม็ด และแอลฟาโกะ มาสเตอร์ ที่มีแต้มต่อสามเม็ดอีกแบบที่แข็งแกร่งขึ้น[61]
เวอร์ชัน | ฮาร์ดแวร์ | การให้คะแนนอีโล | แมตช์ |
---|---|---|---|
แอลฟาโกะ ฝาน | 176 จีพียู,[51] แบบกระจาย | 3,144[50] | 5:0 กับฝาน ฮุย |
แอลฟาโกะ อี | 48 ทีพียู,[51] แบบกระจาย | 3,739[50] | 4:1 กับอี เซ-ดล |
แอลฟาโกะ มาสเตอร์ | 4 ทีพียู,[51] เครื่องเดียว | 4,858[50] | 60:0 กับผู้เล่นระดับอาชีพ; การประชุมสุดยอดหมากล้อมแห่งอนาคต |
แอลฟาโกะ ซีโร | 4 ทีพียู,[51] เครื่องเดียว | 5,185[50] | 100:0 กับแอลฟาโกะ อี
89:11 กับแอลฟาโกะ มาสเตอร์ |
แอลฟาซีโร | 4 ทีพียู, เครื่องเดียว | ไม่สามารถใช้ได้ | 60:40 กับแอลฟาโกะ ซีโร |
ขั้นตอนวิธี
[แก้]ตั้งแต่ปี ค.ศ. 2016 ขั้นตอนวิธีของแอลฟาโกะใช้การรวมกันของการเรียนรู้ของเครื่องและเทคนิคการคำนวณแบบการค้นหาต้นไม้ รวมกับการฝึกแบบกว้าง ทั้งจากการเล่นของมนุษย์และคอมพิวเตอร์ มันใช้การคำนวณแบบการค้นหาต้นไม้มงเต การ์โล ที่นำโดย "เครือข่ายคุณค่า" และ "เครือข่ายนโยบาย" ซึ่งดำเนินการโดยใช้โครงข่ายประสาทเทียมแบบลึก[3][10] จำนวนจำกัดของการตรวจจับคุณลักษณะเฉพาะเกมก่อนการประมวลผล (ตัวอย่างเช่น เพื่อเน้นว่าการเดินตรงกับรูปแบบนากาเดะ) ได้นำมาใช้กับอินพุตก่อนที่จะถูกส่งไปยังโครงข่ายประสาทเทียม[10]
ระบบโครงข่ายประสาทเทียมได้รับการปลุกเครื่องในขั้นต้นจากความชำนาญในการเล่นเกมของมนุษย์ แอลฟาโกะได้รับการฝึกขั้นต้นเพื่อเลียนแบบการเล่นของมนุษย์โดยพยายามจับคู่การเคลื่อนไหวของผู้เล่นระดับอาชีพจากเกมประวัติศาสตร์ที่บันทึกไว้ โดยใช้ฐานข้อมูลประมาณ 30 ล้านรูปแบบการวางหมาก[19] เมื่อมันถึงระดับหนึ่งของความสามารถ มันก็ได้รับการฝึกเพิ่มเติมโดยการตั้งค่าให้เล่นเกมจำนวนมากกับอินสแตนซ์อื่น ๆ ของตัวเอง โดยใช้การเรียนแบบเสริมกำลังเพื่อพัฒนาการเล่นของมัน[3] และเพื่อหลีกเลี่ยงการเสียเวลาของฝ่ายตรงข้าม โปรแกรมจะถูกกำหนดไว้เป็นพิเศษเพื่อยอมแพ้หากมีการประเมินความน่าจะเป็นของชัยชนะภายใต้เกณฑ์บางอย่าง สำหรับการแข่งขันกับอี เกณฑ์การยอมแพ้ถูกกำหนดไว้ที่ 20 เปอร์เซ็นต์[63]
รูปแบบการเล่น
[แก้]โทบี แมนนิง ซึ่งเป็นผู้ตัดสินสำหรับแมตช์แอลฟาโกะพบฝาน ฮุย ได้อธิบายถึงรูปแบบของโปรแกรมว่า "อนุรักษ์นิยม"[64] รูปแบบการเล่นของแอลฟาโกะมีความเป็นไปได้ในการชนะมากกว่าด้วยแต้มน้อยกว่า เหนือความเป็นไปได้ในการแพ้มากกว่าด้วยแต้มมากกว่า[16] กลยุทธ์ของการเพิ่มความน่าจะเป็นของการชนะ แตกต่างจากสิ่งที่ผู้เล่นที่เป็นมนุษย์มนุษย์มีแนวโน้มที่จะทำเพื่อเพิ่มผลกำไรจากพื้นที่ และแจกแจงบางส่วนด้วยการเคลื่อนไหวแปลก ๆ ของมัน[65] มันทำการเดินเปิดเกมหลายแบบที่มนุษย์ไม่เคยหรือไม่ค่อยทำ ในขณะที่มักหลีกเลี่ยงการเปิดเกมในเส้นที่สองที่มนุษย์ชอบทำ มันชอบใช้หมากกดไหล่ โดยเฉพาะอย่างยิ่งหากฝ่ายตรงข้ามมีสมาธิมากกว่า[ต้องการอ้างอิง]
การตอบสนองต่อชัยชนะในปี ค.ศ. 2016
[แก้]สังคมปัญญาประดิษฐ์
[แก้]ชัยชนะในเดือนมีนาคมปี ค.ศ. 2016 ของแอลฟาโกะเป็นก้าวสำคัญในการวิจัยปัญญาประดิษฐ์[66] หมากล้อมได้รับการยกย่องว่าเป็นปัญหาที่ยากในการเรียนรู้ด้วยเครื่องซึ่งคาดว่าจะเป็นไปไม่ได้สำหรับเทคโนโลยีในยุคนั้น[66][67][68] ผู้เชี่ยวชาญส่วนใหญ่คิดว่าโปรแกรมหมากล้อมที่มีประสิทธิภาพอย่างแอลฟาโกะจะต้องใช้เวลาห่างออกไปอย่างน้อยห้าปี[69] โดยผู้เชี่ยวชาญบางคนคิดว่าจะใช้เวลาอย่างน้อยอีกหนึ่งทศวรรษก่อนที่คอมพิวเตอร์จะเอาชนะแชมป์หมากล้อม[10][70][71] ผู้สังเกตการณ์ส่วนใหญ่ในตอนต้นของการแข่งขัน ค.ศ. 2016 คาดว่าอีจะชนะแอลฟาโกะ[66]
พร้อมด้วยเกมเช่นหมากฮอส (ที่ได้ "แก้ปัญหา" โดยทีมผู้เล่นหมากฮอสชีนุก), หมากรุกสากล และปัจจุบันที่หมากล้อมชนะโดยคอมพิวเตอร์ ชัยชนะในเกมกระดานยอดนิยม ไม่สามารถใช้เป็นหลักไมล์สำคัญสำหรับปัญญาประดิษฐ์ในวิถีที่พวกเขาเคยใช้ได้อีกต่อไป เมอร์รีย์ แคมป์เบล แห่งดีปบลู กล่าวถึงชัยชนะของแอลฟาโกะว่า "จุดจบแห่งยุค... พวกเขาได้แสดงให้เห็นว่าเกมกระดานทำได้มากหรือน้อยกว่า และถึงเวลาแล้วที่ต้องก้าวต่อไป"[66]
เมื่อเปรียบเทียบกับดีปบลูหรือกับวัตสัน ขั้นตอนวิธีพื้นฐานของแอลฟาโกะนั้นมีวัตถุประสงค์ทั่วไปมากกว่า และอาจเป็นหลักฐานว่าชุมชนทางวิทยาศาสตร์กำลังก้าวหน้าไปสู่ปัญญาประดิษฐ์ทั่วไป[16][72] ผู้แสดงความคิดเห็นบางคนเชื่อว่าชัยชนะของแอลฟาโกะเป็นโอกาสที่ดีสำหรับสังคมในการเริ่มพูดคุยการเตรียมการสำหรับผลกระทบที่เป็นไปได้ในอนาคตของเครื่องที่มีความฉลาดเอนกประสงค์ (ตามที่ระบุไว้โดยผู้ประกอบการอย่างกาย ซูเตอร์ แอลฟาโกะเองรู้เพียงวิธีเล่นหมากล้อม และไม่มีความฉลาดทางวัตถุประสงค์ทั่วไป: "[มัน] ไม่สามารถตื่นขึ้นมาในเช้าวันหนึ่งและตัดสินใจว่าต้องการเรียนรู้วิธีใช้อาวุธปืน"[66]) ในเดือนมีนาคม ค.ศ. 2016 สจวร์ต รัสเซลล์ นักวิจัยปัญญาประดิษฐ์กล่าวว่า "กระบวนการของปัญญาประดิษฐ์นั้นก้าวหน้าไปเร็วกว่าที่คาดไว้มาก (ซึ่ง) ทำให้คำถามเกี่ยวกับผลระยะยาวที่เร่งด่วนมากขึ้น" และกล่าวเพิ่มเติมว่า "เพื่อให้มั่นใจว่าระบบปัญญาประดิษฐ์ที่มีประสิทธิภาพยิ่งขึ้นยังคงอยู่ภายใต้การควบคุมของมนุษย์... มีงานให้ทำมากมาย"[73] นักวิชาการบางคน เช่น สตีเฟน ฮอว์กิง ได้เตือน (ในเดือนพฤษภาคม ค.ศ. 2015 ก่อนการแข่ง) ว่าการที่ปัญญาประดิษฐ์พัฒนาตัวเองในอนาคตบางอย่างสามารถรับความฉลาดทั่วไปที่เกิดขึ้นจริง โดยนำไปสู่การยึดอำนาจของปัญญาประดิษฐ์ที่ไม่คาดฝัน ส่วนนักวิชาการคนอื่นไม่เห็นด้วย: ฌ็อง-กาเบรียล กานัสเซีย ผู้เชี่ยวชาญด้านปัญญาประดิษฐ์เชื่อว่า "สิ่งต่าง ๆ เช่น 'สามัญสำนึก'... อาจไม่สามารถถอดแบบได้"[74] และกล่าวว่า "ฉันไม่เห็นว่าทำไมเราจะเราจะต้องพูดเกี่ยวกับความกลัว ในทางตรงกันข้าม สิ่งนี้ทำให้เกิดความหวังในหลาย ๆ ด้านเช่นสุขภาพและการสำรวจอวกาศ"[73] และริชาร์ด ซัตตัน นักวิทยาศาสตร์คอมพิวเตอร์ กล่าวว่า "ผมไม่คิดว่าผู้คนควรจะกลัว... แต่ผมคิดว่าผู้คนควรจะให้ความสนใจ"[75]
ในประเทศจีน แอลฟาโกะคือ "ช่วงเวลาแห่งสปุตนิก" ซึ่งช่วยโน้มน้าวให้รัฐบาลจีนจัดลำดับความสำคัญและเพิ่มเงินทุนสำหรับปัญญาประดิษฐ์อย่างมาก[76]
ในปี ค.ศ. 2017 ทีมดีปไมด์แอลฟาโกะได้รับเหรียญสถาปนา ไอเจซีเอไอ มาร์วิน มินสกี สำหรับความสำเร็จที่โดดเด่นในปัญญาประดิษฐ์ “แอลฟาโกะเป็นความสำเร็จที่ยอดเยี่ยม และเป็นตัวอย่างที่สมบูรณ์แบบในสิ่งที่เหรียญมินสกีเริ่มยอมรับ” ศาสตราจารย์ ไมเคิล วูลดริดจ์ ประธานคณะกรรมการรางวัลไอเจซีเอไอกล่าว “สิ่งที่ทำให้ไอเจซีเอไอประทับใจเป็นพิเศษคือแอลฟาโกะประสบความสำเร็จในสิ่งที่ทำผ่านการผสมผสานที่ยอดเยี่ยมของเทคนิคปัญญาประดิษฐ์คลาสสิก รวมถึงเทคนิคการเรียนรู้ของเครื่องจักรที่ล้ำสมัยซึ่งดีปไมด์มีความเกี่ยวข้องอย่างใกล้ชิด โดยเป็นการสาธิตของปัญญาประดิษฐ์ร่วมสมัยที่น่าทึ่ง และเรายินดีที่จะสามารถยอมรับด้วยรางวัลนี้”[77]
สังคมหมากล้อม
[แก้]หมากล้อมเป็นเกมยอดนิยมในประเทศจีน, ญี่ปุ่น และเกาหลี รวมถึงการแข่งขันปี ค.ศ. 2016 นั้น อาจมีผู้ชมทั่วโลกถึงหลายร้อยล้านคน[66][78] ผู้เล่นหมากล้อมระดับสูงหลายคนได้แสดงลักษณะการเล่นนอกรีตของแอลฟาโกะ ในฐานะที่เป็นการเดินที่น่าสงสัยซึ่งเริ่มสร้างความสับสนให้กับผู้ชม แต่มีเหตุผลในความเข้าใจถึงปัญหาหลังเหตุการณ์:[70] "ผู้เล่นทั้งหมดยกเว้นผู้เล่นหมากล้อมที่ดีที่สุดสร้างสรรค์รูปแบบของพวกเขาโดยเลียนแบบผู้เล่นระดับบน ส่วนแอลฟาโกะดูเหมือนว่าจะมีการเคลื่อนไหวต้นฉบับที่สร้างด้วยตนเองทั้งหมด"[66] แอลฟาโกะดูเหมือนจะแข็งแกร่งขึ้นอย่างไม่คาดคิด แม้จะเปรียบเทียบกับการแข่งขันในเดือนตุลาคม ค.ศ. 2015[79] ที่คอมพิวเตอร์ได้เอาชนะมืออาชีพของหมากล้อมเป็นครั้งแรกโดยที่ไม่มีข้อได้เปรียบจากแต้มต่อ[80] วันรุ่งขึ้นหลังจากความพ่ายแพ้ครั้งแรกของอี ผู้สื่อข่าวอย่างช็อง อารัม ได้นำหมากล้อมไปสู่หนึ่งในหนังสือพิมพ์รายวันที่ใหญ่ที่สุดของเกาหลีใต้ โดยกล่าวว่า "เมื่อคืนนี้มืดมนมาก... หลายคนดื่มแอลกอฮอล์"[81] ส่วนสมาคมหมากล้อมแห่งประเทศเกาหลี ซึ่งเป็นองค์กรที่ดูแลหมากล้อมระดับอาชีพในเกาหลีใต้ ได้มอบรางวัล 9 ดั้งกิตติมศักดิ์แก่แอลฟาโกะสำหรับการแสดงทักษะความคิดสร้างสรรค์และผลักดันความก้าวหน้าของเกม[82]
เคอ เจี๋ย อายุ 18 ปีของประเทศจีน ที่ได้รับการยอมรับว่าเป็นผู้เล่นที่ดีที่สุดในโลกในเวลานั้น[30][83] ซึ่งเริ่มแรกอ้างว่าเขาจะสามารถเอาชนะแอลฟาโกะได้ แต่ปฏิเสธที่จะเล่นกับมันเพราะกลัวว่าจะ "คัดลอกสไตล์ของผม"[83] ในขณะที่การแข่งขันดำเนินไป เคอ เจี๋ย กลับไปกลับมา โดยกล่าวว่า "มีโอกาสสูงที่ผม (อาจ) แพ้" หลังจากการวิเคราะห์สามแมตช์แรก[84] แต่คืนความมั่นใจหลังจากแอลฟาโกะแสดงข้อบกพร่องในแมตช์ที่สี่[85]
โทบี แมนนิง ผู้ตัดสินการแข่งขันของแอลฟาโกะกับฝาน ฮุย และอี ฮา-จิน เลขาธิการใหญ่ของสหพันธ์หมากล้อมนานาชาติ ทั้งสองให้เหตุผลในอนาคตว่าผู้เล่นหมากล้อมจะได้รับความช่วยเหลือจากคอมพิวเตอร์เพื่อเรียนรู้สิ่งที่พวกเขาทำผิดในเกมและพัฒนาทักษะของพวกเขา[80]
หลังจากเกมที่สอง อีบอกว่าเขารู้สึก "พูดไม่ออก": "จากจุดเริ่มต้นของการแข่งขัน, ผมไม่สามารถทำการยกมือขึ้นสำหรับการเดินครั้งเดียว มันเป็นชัยชนะทั้งหมดของแอลฟาโกะ"[86] อีขอโทษสำหรับความพ่ายแพ้ของเขา โดยกล่าวหลังจากเกมที่สามว่า "ผมประเมินความสามารถแอลฟาโกะผิดไปและรู้สึกไร้พลัง"[66] เขาย้ำว่าความพ่ายแพ้ครั้งนี้เป็น "ความพ่ายแพ้ของอี เซ-ดล" และ "ไม่ใช่ความพ่ายแพ้ของมนุษยชาติ"[32][74] อีกล่าวว่าการพ่ายแพ้ต่อเครื่องจักรของเขาในที่สุดนั้น "หลีกเลี่ยงไม่ได้" แต่ก็กล่าวด้วยว่า "หุ่นยนต์จะไม่เข้าใจความงามของเกมแบบเดียวกับที่มนุษย์เราทำ"[74] อีกล่าวถึงชัยชนะในเกมที่สี่ของเขาว่า "ชัยชนะอันล้ำค่าที่ผม (จะ) ไม่ยอมแลกเพื่ออะไรเลย"[32]
ระบบที่คล้ายกัน
[แก้]เฟซบุ๊กยังทำงานบนระบบการเล่นหมากล้อมของตัวเองด้วยดาร์กฟอเรสต์ ซึ่งขึ้นอยู่กับการรวมการเรียนรู้ของเครื่องและการค้นหาต้นไม้มงเต การ์โล[64][87] ถึงแม้ว่าผู้เล่นที่แข็งแกร่งได้เผชิญกับโปรแกรมหมากล้อมคอมพิวเตอร์อื่น ๆ ตั้งแต่ต้นปี ค.ศ. 2016 มันก็ยังไม่พ่ายแพ้ต่อผู้เล่นระดับอาชีพ[88] ทั้งนี้ ดาร์กฟอเรสต์แพ้ซอฟต์แวร์เครซีสโตนและเซน ซึ่งคาดว่ามีความแข็งแกร่งที่คล้ายกับเครซีสโตนและเซน[89]
ดีปเซนโกะ ซึ่งเป็นระบบที่พัฒนาขึ้นพร้อมการสนับสนุนจากเว็บไซต์แบ่งปันวิดีโออย่างโดวังโงะและมหาวิทยาลัยโตเกียว ได้เป็นฝ่ายแพ้ 2–1 เกมในเดือนพฤศจิกายน ค.ศ. 2016 แก่ผู้เชี่ยวชาญหมากล้อมอย่างโช ชีฮุน ผู้ครองสถิติชนะหมากล้อมสูงสุดในประเทศญี่ปุ่น[90][91]
ตามเอกสารปี ค.ศ. 2018 ในวารสารเนเจอร์ ได้อ้างถึงแนวทางของแอลฟาโกะในฐานะพื้นฐานสำหรับวิธีการใหม่ในการคำนวณโมเลกุลของยาที่อาจเกิดขึ้น[92]
เกมตัวอย่าง
[แก้]แอลฟาโกะ มาสเตอร์ (หมากขาว) ปะทะถัง เหวยซิง (31 ธันวาคม ค.ศ. 2016) แอลฟาโกะเป็นฝ่ายชนะโดยอีกฝ่ายยอมจำนน หมากขาวที่ 36 ได้รับการยกย่องอย่างกว้างขวาง
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
การเดิน 99 ตาแรก |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
การเดินตาที่ 100–186 (149 ที่ 131, 150 ที่ 130) |
อิทธิพลของหมากล้อม
[แก้]ภาพยนตร์สารคดีแอลฟาโกะ[93][94] ได้หยิบยกความหวังว่าอี เซ-ดล และฝาน ฮุย จะได้รับประโยชน์จากประสบการณ์การเล่นแอลฟาโกะ แต่ ณ เดือนพฤษภาคม ค.ศ. 2018 เรตติงของพวกเขาเปลี่ยนไปเล็กน้อย ซึ่งอี เซ-ดล อยู่ในอันดับที่ 11 ของโลก และฝาน ฮุย อันดับที่ 545[95] อย่างไรก็ตามสังคมหมากล้อมอาจพัฒนาขึ้นในวิธีการเล่นเกม[ต้องการอ้างอิง]
หมายเหตุ
[แก้]อ้างอิง
[แก้]- ↑ "Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol". BBC News. สืบค้นเมื่อ 17 March 2016.
- ↑ "AlphaGo | DeepMind". DeepMind.
- ↑ 3.0 3.1 3.2 3.3 3.4 "Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning". Google Research Blog. 27 January 2016.
- ↑ 4.0 4.1 4.2 4.3 "Google achieves AI 'breakthrough' by beating Go champion". BBC News. 27 January 2016.
- ↑ "Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo". 8 March 2016.
- ↑ "Google's AlphaGo gets 'divine' Go ranking". straitstimes.com. 15 March 2016. สืบค้นเมื่อ 9 December 2017.
- ↑ "AlphaGo Movie".
- ↑ "From AI to protein folding: Our Breakthrough runners-up". Science. 22 December 2016. สืบค้นเมื่อ 29 December 2016.
- ↑ 9.0 9.1 "中国围棋协会授予AlphaGo职业九段 并颁发证书" (ภาษาจีน). Sohu.com. 27 May 2017. สืบค้นเมื่อ 9 December 2017.
- ↑ 10.0 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 January 2016). "Mastering the game of Go with deep neural networks and tree search". Nature. 529 (7587): 484–489. Bibcode:2016Natur.529..484S. doi:10.1038/nature16961. ISSN 0028-0836. PMID 26819042. สืบค้นเมื่อ 10 December 2017.
- ↑ 11.0 11.1 "After Win in China, AlphaGo's Designers Explore New AI". 2017-05-27.
- ↑ Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF)
- ↑ 13.0 13.1 "Computer scores big win against humans in ancient game of Go". CNN. 28 January 2016. สืบค้นเมื่อ 28 January 2016.
- ↑ "Zen computer Go program beats Takemiya Masaki with just 4 stones!". Go Game Guru. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-02-01. สืบค้นเมื่อ 28 January 2016.
- ↑ "「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦". MSN Sankei News. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 24 March 2013. สืบค้นเมื่อ 27 March 2013.
- ↑ 16.0 16.1 16.2 John Riberio (14 March 2016). "AlphaGo's unusual moves prove its AI prowess, experts say". PC World. สืบค้นเมื่อ 18 March 2016.
- ↑ "Artificial intelligence breakthrough as Google's software beats grandmaster of Go, the 'most complex game ever devised'". Daily Mail. 27 January 2016. สืบค้นเมื่อ 29 January 2016.
- ↑ "Google AlphaGo AI clean sweeps European Go champion". ZDNet. 28 January 2016. สืบค้นเมื่อ 28 January 2016.
- ↑ 19.0 19.1 Metz, Cade (27 January 2016). "In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go". WIRED (ภาษาอังกฤษแบบอเมริกัน). สืบค้นเมื่อ 1 February 2016.
- ↑ "Special Computer Go insert covering the AlphaGo v Fan Hui match" (PDF). British Go Journal. สืบค้นเมื่อ 1 February 2016.
- ↑ "Première défaite d'un professionnel du go contre une intelligence artificielle". Le Monde (ภาษาฝรั่งเศส). 27 January 2016.
- ↑ "Google's AI AlphaGo to take on world No 1 Lee Sedol in live broadcast". The Guardian. 5 February 2016. สืบค้นเมื่อ 15 February 2016.
- ↑ "Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea". Business Insider. 22 February 2016. สืบค้นเมื่อ 23 February 2016.
- ↑ Novet, Jordan (4 February 2016). "YouTube will livestream Google's AI playing Go superstar Lee Sedol in March". VentureBeat. สืบค้นเมื่อ 7 February 2016.
- ↑ "李世乭:即使Alpha Go得到升级也一样能赢" (ภาษาจีน). JoongAng Ilbo. 23 February 2016. สืบค้นเมื่อ 24 February 2016.
- ↑ 26.0 26.1 "이세돌 vs 알파고, '구글 딥마인드 챌린지 매치' 기자회견 열려" (ภาษาเกาหลี). Korea Baduk Association. 22 February 2016. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-03-03. สืบค้นเมื่อ 22 February 2016.
- ↑ Demis Hassabis [@demishassabis] (11 March 2016). "We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns" (ทวีต). สืบค้นเมื่อ 14 March 2016 – โดยทาง ทวิตเตอร์.
- ↑ "Showdown". The Economist. สืบค้นเมื่อ 19 November 2016.
- ↑ Steven Borowiec (9 March 2016). "Google's AI machine v world champion of 'Go': everything you need to know". The Guardian. สืบค้นเมื่อ 15 March 2016.
- ↑ 30.0 30.1 Rémi Coulom. "Rating List of 2016-01-01". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 18 March 2016. สืบค้นเมื่อ 18 March 2016.
- ↑ "Korean Go master proves human intuition still powerful in Go". The Korean Herald/ANN. 14 March 2016. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-04-12. สืบค้นเมื่อ 15 March 2016.
- ↑ 32.0 32.1 32.2 Yoon Sung-won (14 March 2016). "Lee Se-dol shows AlphaGo beatable". The Korea Times. สืบค้นเมื่อ 15 March 2016.
- ↑ "Google's AI beats world Go champion in first of five matches – BBC News". BBC Online. สืบค้นเมื่อ 9 March 2016.
- ↑ "Google AI wins second Go game against world champion – BBC News". BBC Online. สืบค้นเมื่อ 10 March 2016.
- ↑ "Google DeepMind AI wins final Go match for 4–1 series win". Engadget. สืบค้นเมื่อ 15 March 2016.
- ↑ "In Two Moves, AlphaGo and Lee Sedol Redefined the Future". WIRED (ภาษาอังกฤษแบบอเมริกัน). สืบค้นเมื่อ 2017-11-12.
- ↑ "黄士杰:AlphaGo李世石人机大战第四局问题已解决date=8 July 2016" (ภาษาจีน). คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2018-10-10. สืบค้นเมื่อ 8 July 2016.
- ↑ 38.0 38.1 Demis Hassabis (4 January 2017). "Demis Hassabis on Twitter: "Excited to share an update on #AlphaGo!"". Demis Hassabis's Twitter account. สืบค้นเมื่อ 4 January 2017.
- ↑ 39.0 39.1 39.2 Elizabeth Gibney (4 January 2017). "Google reveals secret test of AI bot to beat top Go players". Nature. สืบค้นเมื่อ 4 January 2017.
- ↑ 40.0 40.1 40.2 "Humans Mourn Loss After Google Is Unmasked as China's Go Master". Wall Street Journal. 5 January 2017. สืบค้นเมื่อ 6 January 2017.
- ↑ "The world's best Go player says he still has "one last move" to defeat Google's AlphaGo AI". Quartz. 4 January 2017. สืบค้นเมื่อ 6 January 2017.
- ↑ "横扫中日韩棋手斩获59胜的Master发话:我是阿尔法狗" (ภาษาจีน). 澎湃新闻. 4 January 2017. สืบค้นเมื่อ 11 December 2017.
- ↑ "Exploring the mysteries of Go with AlphaGo and China's top players". 2017-04-10. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-04-11. สืบค้นเมื่อ 2018-10-24.
- ↑ "World No.1 Go player Ke Jie takes on upgraded AlphaGo in May". 2017-04-10.
- ↑ "Ke Jie vs. AlphaGo: 8 things you must know". 2017-05-27. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-12-14. สืบค้นเมื่อ 2018-10-27.
- ↑ "8 things you should know about the AlphaGo vs. Ke Jie match". 2017-05-27.
- ↑ "Revamped AlphaGo Wins First Game Against Chinese Go Grandmaster". 2017-05-23.
- ↑ "Google's AlphaGo Continues Dominance With Second Win in China". 2017-05-25.
- ↑ "Full length games for Go players to enjoy". Deepmind. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2019-08-05. สืบค้นเมื่อ 2017-05-28.
- ↑ 50.0 50.1 50.2 50.3 50.4 Silver, David; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian; Lillicrap, Timothy; Fan, Hui; Sifre, Laurent; Driessche, George van den; Graepel, Thore; Hassabis, Demis (19 October 2017). "Mastering the game of Go without human knowledge". Nature. 550 (7676): 354–359. Bibcode:2017Natur.550..354S. doi:10.1038/nature24270. ISSN 0028-0836. สืบค้นเมื่อ 10 December 2017.
- ↑ 51.0 51.1 51.2 51.3 51.4 "AlphaGo Zero: Learning from scratch". DeepMind official website. 18 October 2017. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-10-19. สืบค้นเมื่อ 19 October 2017.
- ↑ Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI].
- ↑ "AlphaZero: Reactions From Top GMs, Stockfish Author". chess.com. 8 December 2017. สืบค้นเมื่อ 13 December 2017.
- ↑ "Talking modern correspondence chess". Chessbase. 26 June 2018. สืบค้นเมื่อ 11 July 2018.
- ↑ "AlphaGo teaching tool". DeepMind.
- ↑ 56.0 56.1 "AlphaGo教学工具上线 樊麾:使用Master版本" (ภาษาจีน). Sina.com.cn. 11 December 2017. สืบค้นเมื่อ 11 December 2017.
- ↑ McMillan, Robert (18 May 2016). "Google Isn't Playing Games With New Chip". Wall Street Journal. สืบค้นเมื่อ 26 June 2016.
- ↑ Jouppi, Norm (May 18, 2016). "Google supercharges machine learning tasks with TPU custom chip". Google Cloud Platform Blog (ภาษาอังกฤษแบบอเมริกัน). Google. สืบค้นเมื่อ 2016-06-26.
- ↑ "AlphaGo官方解读让三子 对人类高手没这种优势" (ภาษาจีน). Sina. 25 May 2017. สืบค้นเมื่อ 2 June 2017.
- ↑ "各版alphago实力对比 master能让李世石版3子" (ภาษาจีน). Sina. 24 May 2017. สืบค้นเมื่อ 2 June 2017.
- ↑ "New version of AlphaGo self-trained and much more efficient". American Go Association. 24 May 2017. สืบค้นเมื่อ 1 June 2017.
- ↑ "【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解" (ภาษาจีน). Sohu. 24 May 2017. สืบค้นเมื่อ 1 June 2017.
- ↑ Cade Metz (13 March 2016). "Go Grandmaster Lee Sedol Grabs Consolation Win Against Google's AI". Wired News. สืบค้นเมื่อ 29 March 2016.
- ↑ 64.0 64.1 Gibney, Elizabeth (27 January 2016). "Google AI algorithm masters ancient game of Go". Nature News & Comment. สืบค้นเมื่อ 3 February 2016.
- ↑ Chouard, Tanguy (12 March 2016). "The Go Files: AI computer clinches victory against Go champion". Nature. doi:10.1038/nature.2016.19553.
- ↑ 66.0 66.1 66.2 66.3 66.4 66.5 66.6 66.7 Steven Borowiec; Tracey Lien (12 March 2016). "AlphaGo beats human Go champ in milestone for artificial intelligence". Los Angeles Times. สืบค้นเมื่อ 13 March 2016.
- ↑ Connor, Steve (27 January 2016). "A computer has beaten a professional at the world's most complex board game". The Independent. สืบค้นเมื่อ 28 January 2016.
- ↑ "Google's AI beats human champion at Go". CBC News. 27 January 2016. สืบค้นเมื่อ 28 January 2016.
- ↑ Dave Gershgorn (12 March 2016). "GOOGLE'S ALPHAGO BEATS WORLD CHAMPION IN THIRD MATCH TO WIN ENTIRE SERIES". Popular Science. สืบค้นเมื่อ 13 March 2016.
- ↑ 70.0 70.1 "Google DeepMind computer AlphaGo sweeps human champ in Go matches". CBC News. Associated Press. 12 March 2016. สืบค้นเมื่อ 13 March 2016.
- ↑ Sofia Yan (12 March 2016). "A Google computer victorious over the world's 'Go' champion". CNN Money. สืบค้นเมื่อ 13 March 2016.
- ↑ "AlphaGo: Google's artificial intelligence to take on world champion of ancient Chinese board game". Australian Broadcasting Corporation. 8 March 2016. สืบค้นเมื่อ 13 March 2016.
- ↑ 73.0 73.1 Mariëtte Le Roux (12 March 2016). "Rise of the Machines: Keep an eye on AI, experts warn". Phys.org. สืบค้นเมื่อ 13 March 2016.
- ↑ 74.0 74.1 74.2 Mariëtte Le Roux; Pascale Mollard (8 March 2016). "Game over? New AI challenge to human smarts (Update)". phys.org. สืบค้นเมื่อ 13 March 2016.
- ↑ Tanya Lewis (11 March 2016). "An AI expert says Google's Go-playing program is missing 1 key feature of human intelligence". Business Insider. สืบค้นเมื่อ 13 March 2016.
- ↑ Mozur, Paul (20 July 2017). "Beijing Wants A.I. to Be Made in China by 2030". The New York Times. สืบค้นเมื่อ 11 April 2018.
- ↑ "Marvin Minsky Medal for Outstanding Achievements in AI". International Joint Conference on Artificial Intelligence (ภาษาอังกฤษ). 19 October 2017. สืบค้นเมื่อ 21 October 2017.
- ↑ CHOE SANG-HUN (16 March 2016). "Google's Computer Program Beats Lee Se-dol in Go Tournament". New York Times. สืบค้นเมื่อ 18 March 2016.
More than 100 million people watched the AlphaGo-Lee matches, Mr. Hassabis said.
- ↑ John Ribeiro (12 March 2016). "Google's AlphaGo AI program strong but not perfect, says defeated South Korean Go player". PC World. สืบค้นเมื่อ 13 March 2016.
- ↑ 80.0 80.1 Gibney, Elizabeth (2016). "Go players react to computer defeat". Nature. doi:10.1038/nature.2016.19255.
- ↑ "How victory for Google's Go AI is stoking fear in South Korea". New Scientist. 15 March 2016. สืบค้นเมื่อ 18 March 2016.
- ↑ JEE HEUN KAHNG; SE YOUNG LEE (15 March 2016). "Google artificial intelligence program beats S. Korean Go pro with 4–1 score". Reuters. สืบค้นเมื่อ 18 March 2016.
- ↑ 83.0 83.1 Neil Connor (11 March 2016). "Google AlphaGo 'can't beat me' says China Go grandmaster". The Telegraph (UK). สืบค้นเมื่อ 13 March 2016.
- ↑ "Chinese Go master Ke Jie says he could lose to AlphaGo : The DONG-A ILBO". สืบค้นเมื่อ 17 March 2016.
- ↑ ""...if today's performance was its true capability, then it doesn't deserve to play against me."". M.hankooki.com. 2016-03-14. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-03-15. สืบค้นเมื่อ 2018-06-05.
- ↑ CHOE SANG-HUN (15 March 2016). "In Seoul, Go Games Spark Interest (and Concern) About Artificial Intelligence". New York Times. สืบค้นเมื่อ 18 March 2016.
- ↑ Tian, Yuandong; Zhu, Yan (2015). "Better Computer Go Player with Neural Network and Long-term Prediction". arXiv:1511.06410v1 [cs.LG].
- ↑ HAL 90210 (28 January 2016). "No Go: Facebook fails to spoil Google's big AI day". The Guardian (ภาษาอังกฤษแบบบริติช). ISSN 0261-3077. สืบค้นเมื่อ 1 February 2016.
- ↑ "Strachey Lecture – Dr Demis Hassabis". The New Livestream. สืบค้นเมื่อ 17 March 2016.
- ↑ "Go master Cho wins best-of-three series against Japan-made AI". The Japan Times Online. 24 November 2016. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-08-14. สืบค้นเมื่อ 27 November 2016.
- ↑ "Humans strike back: Korean Go master bests AI in board game bout". CNET. สืบค้นเมื่อ 27 November 2016.
- ↑ "Go and make some drugs The Engineer". www.theengineer.co.uk (ภาษาอังกฤษ). สืบค้นเมื่อ 2018-04-03.
- ↑ https://www.alphagomovie.com/
- ↑ "AlphaGo (2017)". Rotten Tomatoes. สืบค้นเมื่อ 2018-06-05.
- ↑ "Go Ratings". Go Ratings. สืบค้นเมื่อ 2018-06-05.
แหล่งข้อมูลอื่น
[แก้]- เว็บไซต์ทางการ
- AlphaGo wiki at Sensei's Library, including links to AlphaGo games
- AlphaGo page, with archive and games