ข้ามไปเนื้อหา

เจมินี (แบบจำลองภาษา)

จากวิกิพีเดีย สารานุกรมเสรี
เจมินี
นักพัฒนากูเกิล ดีปไมด์
วันที่เปิดตัว6 ธันวาคม 2023; 12 เดือนก่อน (2023-12-06)
ภาษาอังกฤษ
ประเภทแบบจำลองภาษาขนาดใหญ่
สัญญาอนุญาตจำกัดสิทธิ์
เว็บไซต์deepmind.google/technologies/gemini/ แก้ไขสิ่งนี้ที่วิกิสนเทศ

เจมินี (Gemini) เป็นชุดของแบบจำลองภาษาที่พัฒนาโดยดีปไมด์ของกูเกิล ถือเป็นผู้สืบทอดของ LaMDA และ PaLM2 ประกอบไปด้วย Gemini Ultra, Gemini Pro และ Gemini Nano (ประกาศเมื่อวันที่ 6 ธันวาคม 2023) และถือเป็นคู่แข่งกับ GPT-4 ของ OpenAI

ประวัติศาสตร์

[แก้]

การพัฒนา

[แก้]

กูเกิล ประกาศพัฒนาเจมินี ซึ่งเป็นแบบจำลองภาษาขนาดใหญ่ (LLM) ที่พัฒนาโดยดีปไมด์ บริษัทในเครือ ในระหว่างปาฐกถาพิเศษของกูเกิล ไอโอ เมื่อวันที่ 10 พฤษภาคม 2023 เจมินีถูกวางตำแหน่งให้เป็นผู้สืบทอดที่ทรงพลังกว่า PaLM 2 (ซึ่งเปิดตัวในงานเดียวกัน) แม้ว่าสุนทร ปิจาอี ประธานเจ้าหน้าที่บริหาร จะระบุว่าเจมินียังอยู่ในช่วงเริ่มต้นของการพัฒนา[1][2]

แตกต่างจากแบบจำลองภาษาขนาดใหญ่อื่น ๆ ก่อนหน้า ซึ่งได้รับการฝึกเฉพาะแค่จากคลังข้อความ ตัวแบบเจมินีนั้นได้รับการฝึกโดยการเรียนรู้แบบพหุฐานนิยม นั่นคือฝึกโดยใช้ทั้งข้อความ, รูปภาพ, เสียงพูด, วิดีโอ รวมไปถึงรหัสต้นทางของโปรแกรมคอมพิวเตอร์[3][4] ได้รับการพัฒนาโดยความร่วมมือระหว่างดีปไมด์และ กูเกิลเบรน ซึ่งเป็น 2 แผนกของกูเกิลที่ได้รวมเข้าด้วยกัน[5]

ในการให้สัมภาษณ์กับนิตยสาร Wired เดมิส แฮสซาบิส ประธานเจ้าหน้าที่บริหารของดีปไมด์ กล่าวว่าเขามีความมั่นใจว่ากูเกิลจะสามารถใช้ LaMDA และ บาร์ด เอาชนะแชตจีพีทีซึ่งขับเคลื่อนโดย GPT-4 ของ OpenAI ได้ เขายังกล่าวว่าเจมินีจะรวมพลังของอัลฟาโ AlphaGo และแบบจำลองภาษาขนาดใหญ่อื่น ๆ ของดีปไมด์ เข้าด้วยกัน โดยสร้างจากจุดแข็งของโปรแกรม AlphaGo ของดีปไมด์ (ซึ่งได้รับความสนใจทั่วโลกเมื่อเอาชนะแชมป์หมากล้อม อย่างอี เซ-ดลในปี 2016)[6]

ในเดือนสิงหาคม 2023 เว็บไซต์ The Information [en] เผยแพร่รายงานสรุปแผนงานของกูเกิลสำหรับเจมินี โดยเปิดเผยว่าบริษัทตั้งเป้าที่จะเปิดตัวในช่วงปลายปี 2023 ตามรายงานกูเกิลจะรวมความสามารถด้านข้อความสนทนาที่พบในแบบจำลองภาษาขนาดใหญ่ส่วนใหญ่เข้ากับการสร้างภาพที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ เพื่อสร้างภาพตามบริบทและปรับให้เข้ากับกรณีการใช้งานที่กว้างขึ้น และต้องการมีประสิทธิภาพเหนือกว่า OpenAI และคู่แข่งรายอื่น[7]

เซอร์เกย์ บรินซึ่งเป็นผู้ร่วมก่อตั้งกูเกิลก็ได้ถูกเรียกตัวให้มาช่วยพัฒนาเจมินี[8] พร้อมด้วยวิศวกรอีกหลายร้อยคนจากกูเกิลเบรนและดีปไมด์[7][9] เจมินียังได้รับการฝึกให้ถอดเสียงวิดีโอจาก YouTube อีกด้วย จึงมีการนำทนายความเข้ามาช่วยเพื่อลบเนื้อหาที่อาจติดลิขสิทธิ์ออก[7]

หลังจากข่าวการเปิดตัวของเจมินี ทาง OpenAI จึงรีบรวมความสามารถแบบพหุฐานนิยมเหมือนอย่างในเจมินีเข้าไว้ใน GPT-4[10] ในรายงานของเว็บไซต์ The Information เดือนกันยายนระบุว่า บริษัทหลายแห่งได้รับอนุญาตให้เข้าถึงเวอร์ชันเริ่มต้นของแบบจำลองภาษาขนาดใหญ่ที่กูเกิลตั้งใจที่จะให้บริการแก่ลูกค้าผ่านบริการ Vertex AI ของกูเกิลคลาวด์ รายงานยังระบุด้วยว่ากูเกิลกำลังระดมกำลังเต็มที่เพื่อให้เจมินีเอาชนะทั้ง GPT-4 และ GitHub Copilot ของไมโครซอฟท์[11][12] เมื่อวันที่ 2 ธันวาคม นิตยสารรายงานว่าทางกูเกิลได้เลื่อนการเปิดตัวเจมินีจากสัปดาห์ถัดไปไปเป็นเดือนมกราคม 2024 เนื่องจากยังมีปัญหาการใช้งานข้อความพร้อมรับที่ไม่ใช่ภาษาอังกฤษ และจะมีการจัดกิจกรรมการเปิดตัวเพิ่มเติมอีก 3 รายการในนิวยอร์ก, วอชิงตัน ดี.ซี. และ แคลิฟอร์เนีย[13][14]

การเปิดตัว

[แก้]

เมื่อวันที่ 6 ธันวาคม 2023 ปิจาอีและแฮสซาบิสได้ประกาศ Gemini 1.0 ในงานแถลงข่าว[15][16] มีการประกาศสามรุ่น: Gemini Ultra ออกแบบมาสำหรับ "งานที่ซับซ้อนสูง" Gemini Pro ออกแบบมาสำหรับ "งานที่หลากหลาย" และ Gemini Nano ออกแบบมาสำหรับ "งานบนอุปกรณ์" เมื่อเปิดตัว Gemini Pro และ (Gemini) Nano ได้รวมเข้ากับสมาร์ทโฟน Bard และ Pixel 8 Pro ตามลำดับ ในขณะที่ Gemini Ultra ช่วยเสริมความสามารถให้กับ Bard Advanced และพร้อมใช้งานสำหรับนักพัฒนาซอฟต์แวร์ในต้นปี 2024 ผลิตภัณฑ์อื่น ๆ ที่ Google ตั้งใจจะบรรจุเจมินีเข้าไปได้แก่ กูเกิล เสิร์ช, กูเกิล แอดเวิดส์, กูเกิล โครม ,Duet AI บน กูเกิล เวิร์กสเปซ และ AlphaCode [en][17][16] โดยในตอนแรกมีให้บริการเป็นภาษาอังกฤษเท่านั้น[16][18]

ทางกูเกิลอ้างว่าเจมินีเป็น "แบบจำลองปัญญาประดิษฐ์ที่ใหญ่ที่สุดและมีความสามารถมากที่สุด" ซึ่งออกแบบมาให้เลียนแบบพฤติกรรมของมนุษย์[19][16][20] และกล่าวว่าเจมินีจำเป็นต้องมีการตรวจสอบด้านความปลอดภัยมากจนทำให้ยังไม่สามารถใช้งานอย่างกว้างขวางได้จนกว่าจะถึงปีหน้า[15] เจมินีได้รับการฝึกฝนและขับเคลื่อนโดยหน่วยประมวลผลเทนเซอร์ (TPU) ของกูเกิล[15][18] และตั้งชื่อรวมระหว่าง DeepMind กับ Google Brain และ โครงการเจมินี ของ NASA[21]

มีรายงานว่า Gemini Ultra มีประสิทธิภาพเหนือกว่า GPT-4, Claude2 ของ Anthropic, Inflection2 ของ Inflection AI [en] และ LLaMA2 ของเมตา และ กร็อก ของ xAI ในเกณฑ์มาตรฐานอุตสาหกรรมต่าง ๆ[22][15] ในขณะเดียวกัน Gemini Pro ได้รับการรายงานว่ามีประสิทธิภาพเหนือกว่า GPT-3.5[4] Gemini Ultra ยังเป็นแบบจำลองภาษาแรกที่ทำได้ดีกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ และได้คะแนน 90% จากแบบทดสอบ MMLU ใน 57 วิชา[4][21]

ในวันที่ 13 ธันวาคม 2024 Gemini Pro จะพร้อมใช้งานสำหรับลูกค้ากูเกิลคลาวด์ ใน AI Studio และ Vertex AI ในขณะที่ Gemini Nano จะพร้อมใช้งานสำหรับนักพัฒนาแอนดรอยด์[23][24][25]

แฮสซาบิสเปิดเผยเพิ่มเติมว่าดีปไมด์กำลังหาวิธีการใช้เจมินีเพื่อ "รวมเข้ากับหุ่นยนต์เพื่อโต้ตอบทางกายภาพ"[26] ทางกูเกิลกล่าวว่าจะแบ่งปันผลการทดสอบ Gemini Ultra กับรัฐบาลกลางสหรัฐ ตามคำสั่งประธานาธิบดี 14110 ที่ลงนามโดยประธานาธิบดีโจ ไบเดิน ในเดือนตุลาคม ทางบริษัทยังได้หารือกับ รัฐบาลสหราชอาณาจักร เพื่อปฏิบัติตามหลักการที่กำหนดไว้ในงานประชุมสุดยอดความปลอดภัยเอไอ (AI Safety Summit) ซึ่งจัดขึ้นที่เบลชลีพาร์กในเดือนพฤศจิกายน[4]

อ้างอิง

[แก้]
  1. Grant, Nico (May 10, 2023). "Google Builds on Tech's Latest Craze With Its Own A.I. Products". The New York Times. ISSN 0362-4331. เก็บจากแหล่งเดิมเมื่อ May 10, 2023. สืบค้นเมื่อ August 21, 2023.
  2. Ortiz, Sabrina (May 10, 2023). "Every major AI feature announced at Google I/O 2023". ZDNet. เก็บจากแหล่งเดิมเมื่อ May 10, 2023. สืบค้นเมื่อ August 21, 2023.
  3. Wankhede, Calvin (June 4, 2023). "What is Google Gemini: The next-gen language model that can do it all". Android Authority. เก็บจากแหล่งเดิมเมื่อ June 5, 2023. สืบค้นเมื่อ August 21, 2023.
  4. 4.0 4.1 4.2 4.3 Milmo, Dan (December 6, 2023). "Google says new AI model Gemini outperforms ChatGPT in most tests". The Guardian. ISSN 0261-3077. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  5. Levy, Steven (September 11, 2023). "Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI?". Wired. เก็บจากแหล่งเดิมเมื่อ September 11, 2023. สืบค้นเมื่อ September 12, 2023.
  6. Knight, Will (June 26, 2023). "Google DeepMind's CEO Says Its Next Algorithm Will Eclipse ChatGPT". Wired. เก็บจากแหล่งเดิมเมื่อ June 26, 2023. สืบค้นเมื่อ August 21, 2023.
  7. 7.0 7.1 7.2 Victor, Jon (August 15, 2023). "How Google is Planning to Beat OpenAI". The Information. เก็บจากแหล่งเดิมเมื่อ August 15, 2023. สืบค้นเมื่อ August 21, 2023.
  8. Grant, Nico (January 20, 2023). "Google Calls In Help From Larry Page and Sergey Brin for A.I. Fight". The New York Times. ISSN 0362-4331. เก็บจากแหล่งเดิมเมื่อ January 20, 2023. สืบค้นเมื่อ February 6, 2023.
  9. Kruppa, Miles; Seetharaman, Deepa (July 21, 2023). "Sergey Brin Is Back in the Trenches at Google". The Wall Street Journal. ISSN 0099-9660. เก็บจากแหล่งเดิมเมื่อ July 21, 2023. สืบค้นเมื่อ September 7, 2023.
  10. Victor, Jon (September 18, 2023). "OpenAI Hustles to Beat Google to Launch 'Multimodal' LLM". The Information. เก็บจากแหล่งเดิมเมื่อ September 18, 2023. สืบค้นเมื่อ October 15, 2023.
  11. "Google nears release of AI software Gemini, The Information reports". Reuters. September 14, 2023. เก็บจากแหล่งเดิมเมื่อ September 15, 2023. สืบค้นเมื่อ October 2, 2023.
  12. Nolan, Beatrice (September 23, 2023). "Google is quietly handing out early demos of its GPT-4 rival called Gemini. Here's what we know so far about the upcoming AI model". Business Insider. เก็บจากแหล่งเดิมเมื่อ September 23, 2023. สืบค้นเมื่อ October 16, 2023.
  13. Victor, Jon; Efrati, Amir (December 2, 2023). "Google Preps Public Preview of Gemini AI After Postponing In-Person Launch Events". The Information. เก็บจากแหล่งเดิมเมื่อ December 2, 2023. สืบค้นเมื่อ December 6, 2023.
  14. Tangalakis-Lippert, Katherine (December 2, 2023). "Google has quietly pushed back the launch of next-gen AI model Gemini until next year, report says". Business Insider. เก็บจากแหล่งเดิมเมื่อ December 3, 2023. สืบค้นเมื่อ December 6, 2023.
  15. 15.0 15.1 15.2 15.3 Kruppa, Miles (December 6, 2023). "Google Announces AI System Gemini After Turmoil at Rival OpenAI". The Wall Street Journal. ISSN 0099-9660. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  16. 16.0 16.1 16.2 16.3 Liedtike, Michael; O'Brien, Matt (December 6, 2023). "Google launches Gemini, upping the stakes in the global AI race". Associated Press. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  17. Edwards, Benj (December 6, 2023). "Google launches Gemini—a powerful AI model it says can surpass GPT-4". Ars Technica. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  18. 18.0 18.1 Pierce, David (December 6, 2023). "Google launches Gemini, the AI model it hopes will take down GPT-4". The Verge. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  19. Fung, Brian; Thorbecke, Catherine (December 6, 2023). "Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT". CNN Business. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  20. "Google launches Gemini, upping the stakes in the global AI race". CBS News. December 6, 2023. เก็บจากแหล่งเดิมเมื่อ December 7, 2023. สืบค้นเมื่อ December 7, 2023.
  21. 21.0 21.1 Knight, Will (December 6, 2023). "Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT". Wired. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  22. Henshall, Will (December 6, 2023). "Google DeepMind Unveils Its Most Powerful AI Offering Yet". Time. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  23. Metz, Cade; Grant, Nico (December 6, 2023). "Google Updates Bard Chatbot With 'Gemini' A.I. as It Chases ChatGPT". The New York Times. ISSN 0362-4331. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  24. Elias, Jennifer (December 6, 2023). "Google launches its largest and 'most capable' AI model, Gemini". CNBC. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 6, 2023.
  25. Alba, Davey; Ghaffary, Shirin (December 6, 2023). "Google Opens Access to Gemini, Racing to Catch Up to OpenAI". Bloomberg News. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 7, 2023.
  26. Knight, Will (December 6, 2023). "Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI". Wired. เก็บจากแหล่งเดิมเมื่อ December 6, 2023. สืบค้นเมื่อ December 7, 2023.