เจมินี (แบบจำลองภาษา)
นักพัฒนา | กูเกิล ดีปไมด์ |
---|---|
วันที่เปิดตัว | 6 ธันวาคม 2023 |
ภาษา | อังกฤษ |
ประเภท | แบบจำลองภาษาขนาดใหญ่ |
สัญญาอนุญาต | จำกัดสิทธิ์ |
เว็บไซต์ | deepmind |
เจมินี (Gemini) เป็นชุดของแบบจำลองภาษาที่พัฒนาโดยดีปไมด์ของกูเกิล ถือเป็นผู้สืบทอดของ LaMDA และ PaLM2 ประกอบไปด้วย Gemini Ultra, Gemini Pro และ Gemini Nano (ประกาศเมื่อวันที่ 6 ธันวาคม 2023) และถือเป็นคู่แข่งกับ GPT-4 ของ OpenAI
ประวัติศาสตร์
[แก้]การพัฒนา
[แก้]กูเกิล ประกาศพัฒนาเจมินี ซึ่งเป็นแบบจำลองภาษาขนาดใหญ่ (LLM) ที่พัฒนาโดยดีปไมด์ บริษัทในเครือ ในระหว่างปาฐกถาพิเศษของกูเกิล ไอโอ เมื่อวันที่ 10 พฤษภาคม 2023 เจมินีถูกวางตำแหน่งให้เป็นผู้สืบทอดที่ทรงพลังกว่า PaLM 2 (ซึ่งเปิดตัวในงานเดียวกัน) แม้ว่าสุนทร ปิจาอี ประธานเจ้าหน้าที่บริหาร จะระบุว่าเจมินียังอยู่ในช่วงเริ่มต้นของการพัฒนา[1][2]
แตกต่างจากแบบจำลองภาษาขนาดใหญ่อื่น ๆ ก่อนหน้า ซึ่งได้รับการฝึกเฉพาะแค่จากคลังข้อความ ตัวแบบเจมินีนั้นได้รับการฝึกโดยการเรียนรู้แบบพหุฐานนิยม นั่นคือฝึกโดยใช้ทั้งข้อความ, รูปภาพ, เสียงพูด, วิดีโอ รวมไปถึงรหัสต้นทางของโปรแกรมคอมพิวเตอร์[3][4] ได้รับการพัฒนาโดยความร่วมมือระหว่างดีปไมด์และ กูเกิลเบรน ซึ่งเป็น 2 แผนกของกูเกิลที่ได้รวมเข้าด้วยกัน[5]
ในการให้สัมภาษณ์กับนิตยสาร Wired เดมิส แฮสซาบิส ประธานเจ้าหน้าที่บริหารของดีปไมด์ กล่าวว่าเขามีความมั่นใจว่ากูเกิลจะสามารถใช้ LaMDA และ บาร์ด เอาชนะแชตจีพีทีซึ่งขับเคลื่อนโดย GPT-4 ของ OpenAI ได้ เขายังกล่าวว่าเจมินีจะรวมพลังของอัลฟาโ AlphaGo และแบบจำลองภาษาขนาดใหญ่อื่น ๆ ของดีปไมด์ เข้าด้วยกัน โดยสร้างจากจุดแข็งของโปรแกรม AlphaGo ของดีปไมด์ (ซึ่งได้รับความสนใจทั่วโลกเมื่อเอาชนะแชมป์หมากล้อม อย่างอี เซ-ดลในปี 2016)[6]
ในเดือนสิงหาคม 2023 เว็บไซต์ The Information เผยแพร่รายงานสรุปแผนงานของกูเกิลสำหรับเจมินี โดยเปิดเผยว่าบริษัทตั้งเป้าที่จะเปิดตัวในช่วงปลายปี 2023 ตามรายงานกูเกิลจะรวมความสามารถด้านข้อความสนทนาที่พบในแบบจำลองภาษาขนาดใหญ่ส่วนใหญ่เข้ากับการสร้างภาพที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ เพื่อสร้างภาพตามบริบทและปรับให้เข้ากับกรณีการใช้งานที่กว้างขึ้น และต้องการมีประสิทธิภาพเหนือกว่า OpenAI และคู่แข่งรายอื่น[7]
เซอร์เกย์ บรินซึ่งเป็นผู้ร่วมก่อตั้งกูเกิลก็ได้ถูกเรียกตัวให้มาช่วยพัฒนาเจมินี[8] พร้อมด้วยวิศวกรอีกหลายร้อยคนจากกูเกิลเบรนและดีปไมด์[7][9] เจมินียังได้รับการฝึกให้ถอดเสียงวิดีโอจาก YouTube อีกด้วย จึงมีการนำทนายความเข้ามาช่วยเพื่อลบเนื้อหาที่อาจติดลิขสิทธิ์ออก[7]
หลังจากข่าวการเปิดตัวของเจมินี ทาง OpenAI จึงรีบรวมความสามารถแบบพหุฐานนิยมเหมือนอย่างในเจมินีเข้าไว้ใน GPT-4[10] ในรายงานของเว็บไซต์ The Information เดือนกันยายนระบุว่า บริษัทหลายแห่งได้รับอนุญาตให้เข้าถึงเวอร์ชันเริ่มต้นของแบบจำลองภาษาขนาดใหญ่ที่กูเกิลตั้งใจที่จะให้บริการแก่ลูกค้าผ่านบริการ Vertex AI ของกูเกิลคลาวด์ รายงานยังระบุด้วยว่ากูเกิลกำลังระดมกำลังเต็มที่เพื่อให้เจมินีเอาชนะทั้ง GPT-4 และ GitHub Copilot ของไมโครซอฟท์[11][12] เมื่อวันที่ 2 ธันวาคม นิตยสารรายงานว่าทางกูเกิลได้เลื่อนการเปิดตัวเจมินีจากสัปดาห์ถัดไปไปเป็นเดือนมกราคม 2024 เนื่องจากยังมีปัญหาการใช้งานข้อความพร้อมรับที่ไม่ใช่ภาษาอังกฤษ และจะมีการจัดกิจกรรมการเปิดตัวเพิ่มเติมอีก 3 รายการในนิวยอร์ก, วอชิงตัน ดี.ซี. และ แคลิฟอร์เนีย[13][14]
การเปิดตัว
[แก้]เมื่อวันที่ 6 ธันวาคม 2023 ปิจาอีและแฮสซาบิสได้ประกาศ Gemini 1.0 ในงานแถลงข่าว[15][16] มีการประกาศสามรุ่น: Gemini Ultra ออกแบบมาสำหรับ "งานที่ซับซ้อนสูง" Gemini Pro ออกแบบมาสำหรับ "งานที่หลากหลาย" และ Gemini Nano ออกแบบมาสำหรับ "งานบนอุปกรณ์" เมื่อเปิดตัว Gemini Pro และ (Gemini) Nano ได้รวมเข้ากับสมาร์ทโฟน Bard และ Pixel 8 Pro ตามลำดับ ในขณะที่ Gemini Ultra ช่วยเสริมความสามารถให้กับ Bard Advanced และพร้อมใช้งานสำหรับนักพัฒนาซอฟต์แวร์ในต้นปี 2024 ผลิตภัณฑ์อื่น ๆ ที่ Google ตั้งใจจะบรรจุเจมินีเข้าไปได้แก่ กูเกิล เสิร์ช, กูเกิล แอดเวิดส์, กูเกิล โครม ,Duet AI บน กูเกิล เวิร์กสเปซ และ AlphaCode[17][16] โดยในตอนแรกมีให้บริการเป็นภาษาอังกฤษเท่านั้น[16][18]
ทางกูเกิลอ้างว่าเจมินีเป็น "แบบจำลองปัญญาประดิษฐ์ที่ใหญ่ที่สุดและมีความสามารถมากที่สุด" ซึ่งออกแบบมาให้เลียนแบบพฤติกรรมของมนุษย์[19][16][20] และกล่าวว่าเจมินีจำเป็นต้องมีการตรวจสอบด้านความปลอดภัยมากจนทำให้ยังไม่สามารถใช้งานอย่างกว้างขวางได้จนกว่าจะถึงปีหน้า[15] เจมินีได้รับการฝึกฝนและขับเคลื่อนโดยหน่วยประมวลผลเทนเซอร์ (TPU) ของกูเกิล[15][18] และตั้งชื่อรวมระหว่าง DeepMind กับ Google Brain และ โครงการเจมินี ของ NASA[21]
มีรายงานว่า Gemini Ultra มีประสิทธิภาพเหนือกว่า GPT-4, Claude2 ของ Anthropic, Inflection2 ของ Inflection AI และ LLaMA2 ของเมตา และ กร็อก ของ xAI ในเกณฑ์มาตรฐานอุตสาหกรรมต่าง ๆ[22][15] ในขณะเดียวกัน Gemini Pro ได้รับการรายงานว่ามีประสิทธิภาพเหนือกว่า GPT-3.5[4] Gemini Ultra ยังเป็นแบบจำลองภาษาแรกที่ทำได้ดีกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ และได้คะแนน 90% จากแบบทดสอบ MMLU ใน 57 วิชา[4][21]
ในวันที่ 13 ธันวาคม 2024 Gemini Pro จะพร้อมใช้งานสำหรับลูกค้ากูเกิลคลาวด์ ใน AI Studio และ Vertex AI ในขณะที่ Gemini Nano จะพร้อมใช้งานสำหรับนักพัฒนาแอนดรอยด์[23][24][25]
แฮสซาบิสเปิดเผยเพิ่มเติมว่าดีปไมด์กำลังหาวิธีการใช้เจมินีเพื่อ "รวมเข้ากับหุ่นยนต์เพื่อโต้ตอบทางกายภาพ"[26] ทางกูเกิลกล่าวว่าจะแบ่งปันผลการทดสอบ Gemini Ultra กับรัฐบาลกลางสหรัฐ ตามคำสั่งประธานาธิบดี 14110 ที่ลงนามโดยประธานาธิบดีโจ ไบเดิน ในเดือนตุลาคม ทางบริษัทยังได้หารือกับ รัฐบาลสหราชอาณาจักร เพื่อปฏิบัติตามหลักการที่กำหนดไว้ในงานประชุมสุดยอดความปลอดภัยเอไอ (AI Safety Summit) ซึ่งจัดขึ้นที่เบลชลีพาร์กในเดือนพฤศจิกายน[4]
อ้างอิง
[แก้]- ↑ Grant, Nico (May 10, 2023). "Google Builds on Tech's Latest Craze With Its Own A.I. Products". The New York Times. ISSN 0362-4331. เก็บจากแหล่งเดิมเมื่อ May 10, 2023. สืบค้นเมื่อ August 21, 2023.
- ↑ Ortiz, Sabrina (May 10, 2023). "Every major AI feature announced at Google I/O 2023". ZDNet. เก็บจากแหล่งเดิมเมื่อ May 10, 2023. สืบค้นเมื่อ August 21, 2023.
- ↑ Wankhede, Calvin (June 4, 2023). "What is Google Gemini: The next-gen language model that can do it all". Android Authority. เก็บจากแหล่งเดิมเมื่อ June 5, 2023. สืบค้นเมื่อ August 21, 2023.
- ↑ 4.0 4.1 4.2 4.3 Milmo, Dan (December 6, 2023). "Google says new AI model Gemini outperforms ChatGPT in most tests". The Guardian. ISSN 0261-3077. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Levy, Steven (September 11, 2023). "Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI?". Wired. เก็บจากแหล่งเดิมเมื่อ September 11, 2023. สืบค้นเมื่อ September 12, 2023.
- ↑ Knight, Will (June 26, 2023). "Google DeepMind's CEO Says Its Next Algorithm Will Eclipse ChatGPT". Wired. เก็บจากแหล่งเดิมเมื่อ June 26, 2023. สืบค้นเมื่อ August 21, 2023.
- ↑ 7.0 7.1 7.2 Victor, Jon (August 15, 2023). "How Google is Planning to Beat OpenAI". The Information. เก็บจากแหล่งเดิมเมื่อ August 15, 2023. สืบค้นเมื่อ August 21, 2023.
- ↑ Grant, Nico (January 20, 2023). "Google Calls In Help From Larry Page and Sergey Brin for A.I. Fight". The New York Times. ISSN 0362-4331. เก็บจากแหล่งเดิมเมื่อ January 20, 2023. สืบค้นเมื่อ February 6, 2023.
- ↑ Kruppa, Miles; Seetharaman, Deepa (July 21, 2023). "Sergey Brin Is Back in the Trenches at Google". The Wall Street Journal. ISSN 0099-9660. เก็บจากแหล่งเดิมเมื่อ July 21, 2023. สืบค้นเมื่อ September 7, 2023.
- ↑ Victor, Jon (September 18, 2023). "OpenAI Hustles to Beat Google to Launch 'Multimodal' LLM". The Information. เก็บจากแหล่งเดิมเมื่อ September 18, 2023. สืบค้นเมื่อ October 15, 2023.
- ↑ "Google nears release of AI software Gemini, The Information reports". Reuters. September 14, 2023. เก็บจากแหล่งเดิมเมื่อ September 15, 2023. สืบค้นเมื่อ October 2, 2023.
- ↑ Nolan, Beatrice (September 23, 2023). "Google is quietly handing out early demos of its GPT-4 rival called Gemini. Here's what we know so far about the upcoming AI model". Business Insider. เก็บจากแหล่งเดิมเมื่อ September 23, 2023. สืบค้นเมื่อ October 16, 2023.
- ↑ Victor, Jon; Efrati, Amir (December 2, 2023). "Google Preps Public Preview of Gemini AI After Postponing In-Person Launch Events". The Information. เก็บจากแหล่งเดิมเมื่อ December 2, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Tangalakis-Lippert, Katherine (December 2, 2023). "Google has quietly pushed back the launch of next-gen AI model Gemini until next year, report says". Business Insider. เก็บจากแหล่งเดิมเมื่อ December 3, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ 15.0 15.1 15.2 15.3 Kruppa, Miles (December 6, 2023). "Google Announces AI System Gemini After Turmoil at Rival OpenAI". The Wall Street Journal. ISSN 0099-9660. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ 16.0 16.1 16.2 16.3 Liedtike, Michael; O'Brien, Matt (December 6, 2023). "Google launches Gemini, upping the stakes in the global AI race". Associated Press. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Edwards, Benj (December 6, 2023). "Google launches Gemini—a powerful AI model it says can surpass GPT-4". Ars Technica. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ 18.0 18.1 Pierce, David (December 6, 2023). "Google launches Gemini, the AI model it hopes will take down GPT-4". The Verge. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Fung, Brian; Thorbecke, Catherine (December 6, 2023). "Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT". CNN Business. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ "Google launches Gemini, upping the stakes in the global AI race". CBS News. December 6, 2023. เก็บจากแหล่งเดิมเมื่อ December 7, 2023. สืบค้นเมื่อ December 7, 2023.
- ↑ 21.0 21.1 Knight, Will (December 6, 2023). "Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT". Wired. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Henshall, Will (December 6, 2023). "Google DeepMind Unveils Its Most Powerful AI Offering Yet". Time. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Metz, Cade; Grant, Nico (December 6, 2023). "Google Updates Bard Chatbot With 'Gemini' A.I. as It Chases ChatGPT". The New York Times. ISSN 0362-4331. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Elias, Jennifer (December 6, 2023). "Google launches its largest and 'most capable' AI model, Gemini". CNBC. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
- ↑ Alba, Davey; Ghaffary, Shirin (December 6, 2023). "Google Opens Access to Gemini, Racing to Catch Up to OpenAI". Bloomberg News. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 7, 2023.
- ↑ Knight, Will (December 6, 2023). "Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI". Wired. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 7, 2023.