AI Poker Bot Pluribus ชนะมือโปรที่ดีที่สุดใน NLHE แบบผู้เล่นหลายคน

Horoscope Lottery Predictions For December 2019



บอทเกมโป๊กเกอร์ใหม่ได้รับการพัฒนาโดยนักวิจัยกลุ่มเดียวกับที่เปิดตัว Libratus ในปี 2560 คราวนี้ประสบความสำเร็จในการเอาชนะทีมผู้เล่นโป๊กเกอร์ชั้นนำในเกม NLHE ผู้เล่น 6 คน Facebook ได้ร่วมมือกับนักวิจัยจาก Carnegie Mellon University ซึ่งนำโดยศาสตราจารย์ Tuomas Sandholm ของ CMU และ Noam Brown นักศึกษาระดับบัณฑิตศึกษาของเขาเพื่อวางแผนการประลองที่มีผู้เล่นโป๊กเกอร์ที่ดีที่สุดในอุตสาหกรรมเพื่อแนะนำซูเปอร์คอมพิวเตอร์โป๊กเกอร์ AI เวอร์ชันล่าสุด เรียกว่า “พลูริบัส” ผลการวิจัยที่ตีพิมพ์ในวารสาร Science เมื่อต้นเดือนนี้น่าตกใจ บอทเอาชนะศัตรูที่ AI อื่นไม่สามารถทำได้มาก่อน (โปรแกรม AI รุ่นเก่าสามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) ผลของโครงการนี้คาดว่าจะมีผลอย่างมากต่อการวิจัย AI และเกมโป๊กเกอร์เอง Two TrialsPoker ถือเป็นเกมที่รวบรวมปัญหาของข้อมูลที่ซ่อนอยู่ได้เป็นอย่างดีดังนั้นนักวิจัยจึงใช้มันเป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามจนกระทั่ง Pluribus ปรากฏตัวไม่มีเครื่องใดเอาชนะผู้เล่นที่เป็นมนุษย์ได้จริงในการตั้งค่า Texas Hold’em แบบผู้เล่นหลายคนที่ไม่ จำกัด (รูปแบบที่นิยมมากที่สุดในการเล่นโป๊กเกอร์) Pluribus ต่อสู้กับมือโปรโป๊กเกอร์ที่ดีที่สุดในรูปแบบ NLHE 6-max เขาเป็นผู้เชี่ยวชาญ 6-max ที่มีรายได้อย่างน้อย 1 ล้านเหรียญในอาชีพโป๊กเกอร์มืออาชีพ พลูริบัสผ่านการทดสอบที่แตกต่างกันสองครั้ง ในการทดลองครั้งแรกมนุษย์ 5 คนและ 1 AI (5H + 1AI) ต่อต้านกันในขณะที่ในการทดลองครั้งที่ 2 1 คนต่อต้านร่างโคลน Pluribus (1H + 5AI) 5 คนโดยคำนึงว่าบอทไม่ได้รับอนุญาตมีเพียง คน. ในการสื่อสารพวกเขาป้องกันการสมรู้ร่วมคิดเพราะพวกเขาไม่รู้ว่าพวกเขากำลังแข่งขันกับใคร การทดลองชัยชนะสองครั้งของ Pluribus ส่งผลให้อัตราการชนะของ Pluribus สูงขึ้นอย่างมากเมื่อเทียบกับผู้เล่นโป๊กเกอร์ที่เป็นมนุษย์ ผู้เล่นบางคนที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage ใช้ชื่อเล่นระหว่างเล่น ในการทดลอง 5H + 1AI มีการเล่นทั้งหมด 10,000 มือในช่วง 12 วันและในการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์ Darren Elias และ Chris Ferguson เล่น 5,000 มือต่อสำเนา Pluribus 5 ชุด เมื่อรวมผลลัพธ์ตามบล็อกโพสต์ Facebook AI ของ Noam Brown ค่าใช้จ่ายสำหรับบอทที่จะเอาชนะคนได้คือประมาณ 5 เหรียญต่อมือและประมาณ 1,000 เหรียญต่อชั่วโมง Pluribus vs Pros Video Demo: สิ่งที่ผู้เชี่ยวชาญโป๊กเกอร์คิดเกี่ยวกับ AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมการทดลองพูดเกี่ยวกับบอทโป๊กเกอร์ล่าสุด Seth Davies: “สิ่งที่กระตุ้นมากที่สุดในการแข่งขันกับ Pluribus คือการตอบสนองต่อกลยุทธ์ก่อนการปัดที่ซับซ้อนซึ่งแตกต่างจากมนุษย์ Pluribus ใช้การเพิ่มขนาดก่อนปัดหลายครั้งความพยายามที่จะตอบโต้ช่วงเปิดที่ไม่ใช่เชิงเส้นนั้นแตกต่างจากเกมของมนุษย์ เป็นอีกหนึ่งความท้าทายที่สนุก ” Jason Les: “นี่คือมอนสเตอร์ที่เบลออย่างแน่นอนผมบอกได้เลยว่ามันเบลอได้อย่างมีประสิทธิภาพมากกว่ามนุษย์ส่วนใหญ่นั่นเป็นเหตุผลว่าทำไมมันจึงยากที่จะจัดการ AI อยู่ในสถานการณ์ภายใต้ความกดดันอย่างมากที่นี่มีบลัฟอยู่เสมอ มีแนวโน้มที่จะเกิดขึ้น” จิมมี่โชว:“ ทุกครั้งที่ใช้บอทฉันรู้สึกอยากเลือกสิ่งใหม่ ๆ เพื่อรวมเข้ากับเกมในฐานะมนุษย์ฉันคิดว่าฉันมักจะปรับแต่งเกมให้เรียบง่ายเกินไปเพื่อให้ง่ายต่อการนำกลยุทธ์มาใช้และจดจำ บอทซิลเวอร์ไม่ยอมรับเรื่องนี้เขามีโครงสร้างเกมที่ซับซ้อนและมีความสมดุลสำหรับทุกการตัดสินใจ” คริสเฟอร์กูสัน:“ พลูริบัสเป็นคู่ต่อสู้ที่รับมือได้ยากมากมันยากมากที่จะแก้ไขเขาไม่ว่าจะด้วยมือใดก็ตามเขายัง บนแม่น้ำเก่งมากในการเดิมพันมูลค่าบาง ๆ เขาเก่งมากในการดึงคุณค่าจากจุดแข็งของเขาเป็นเจ้าของ ” Darren Elias: “บอทโป๊กเกอร์ AI ห้าเวอร์ชันนี้กับฉันฉันจะเล่นกับมือนับพันทุกวันฉันพัฒนาจากผู้เล่นทั่วไปไปสู่ระดับโลกโดยทั่วไปฉันสร้างผู้เล่นโป๊กเกอร์ระดับในไม่กี่วันและ สัปดาห์ค่อนข้างน้อยมันน่ากลัว” Pluribus สรุปได้ตอนนี้ปลอดภัยแล้วที่จะพูดได้ว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดในโลกไม่มีหน้าโป๊กเกอร์ หลักหรือกลยุทธ์พิมพ์เขียวของพลูริบัสถูกสร้างขึ้นด้วยการเล่นของตัวเองหรือผ่านการแข่งขันกับโคลนนิ่ง นี่เป็นวิธีเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมเครือข่ายประสาทเทียม 5 ทีมที่ฝึกฝนมานาน 45,000 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้ พลูริบัสสอนตัวเองตั้งแต่เริ่มต้นโดยใช้ประเภท การเรียนรู้แบบเสริมกำลังเช่น AlphaZero ที่ใช้โดย Go AI ของ DeepMind เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและปรับปรุงเมื่อคุณตัดสินใจว่าการกระทำใดจะทำให้คุณได้รับเงินมากขึ้น หลังจากแต่ละมือคุณจำได้ว่าคุณเล่นอย่างไรและแทนที่จะยึดติดกับการเดิมพันของคุณให้พิจารณาว่าคุณทำเงินได้มากขึ้นด้วยการกระทำที่แตกต่างกันเช่นการเพิ่ม หากทางเลือกนั้นนำไปสู่ผลลัพธ์ที่ดีกว่าคุณมีแนวโน้มที่จะเลือกทางเลือกในสถานการณ์ในอนาคต พลูริบัสได้สร้างมือโป๊กเกอร์หลายล้านล้านมือขึ้นมาเองโดยกำหนดกลยุทธ์พื้นฐานตามมาในการแข่งขัน สำหรับการตัดสินใจทุกครั้ง Pluribus จะเปรียบเทียบสถานะของเกมกับพิมพ์เขียวและคาดการณ์การเคลื่อนไหวเล็กน้อยเพื่อดูว่าเกมกำลังดำเนินไปอย่างไร จากนั้นตัดสินใจว่าสามารถปรับปรุงได้หรือไม่ ด้วยการเรียนรู้ด้วยตนเองโดยปราศจากการแทรกแซงของมนุษย์ Pluribus ใช้กลยุทธ์หลายอย่างที่ผู้เล่นที่เป็นมนุษย์ไม่อาจใช้ ความสำเร็จของพลูริบัสเกิดจากประสิทธิภาพเป็นหลัก เมื่อเล่นโป๊กเกอร์มันจะทำงานบนหน่วยประมวลผลกลาง (ซีพียู) สองหน่วยเท่านั้นซึ่งแตกต่างจากซีพียู 100 ตัวของ Libratus และ Go bot ดั้งเดิมของ DeepMind เมื่อพลูริบัสเล่นกับตัวเองเขาเล่นแฮนด์เพลย์ในเวลาประมาณ 20 วินาที ซึ่งเร็วกว่าผู้เล่นมืออาชีพประมาณสองเท่า สิ่งที่ยอดเยี่ยมอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ที่มีราคาเพียง 144 เหรียญในการทำงาน จากการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.6 ล้านดอลลาร์ซึ่งมีราคาแพงมากในการทำงาน แน่นอนว่าการทดลองนี้ไม่ได้จบลงด้วยโป๊กเกอร์ ความสามารถในการเอาชนะนักโป๊กเกอร์มืออาชีพที่เก่งที่สุดในเกมหกมือถือเป็นความสำเร็จที่ยอดเยี่ยม แต่ก็แสดงให้เห็นว่าพลังในการคำนวณสามารถตอบสนองวัตถุประสงค์ที่แตกต่างจากการเล่นไพ่ การค้นพบนี้ยืนยันว่า AI สามารถทำงานได้ในระดับที่เหนือกว่ามนุษย์ในสถานการณ์ที่มีการ จำกัด การเข้าถึงหัวข้อและข้อมูลที่หลากหลายและสามารถนำไปใช้ได้ทุกที่ตั้งแต่วาณิชธนกิจและกลยุทธ์การเจรจาไปจนถึงเทคโนโลยีรถยนต์ขับเคลื่อนด้วยตนเอง ตอนนี้ Pluribus ได้เข้าร่วมในเกมเช่น Chess and Go ซึ่งเป็นสองเกมที่ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกต้องพ่ายแพ้ด้วยปัญญาประดิษฐ์ ที่มา: https://science.sciencemag.org/content/early/2019/07/10/science.aay2400


เกม คาสิโน ได้เงินจริง
เกม คาสิโน ออนไลน์
คาสิโน ใหม่ ล่าสุด
คาสิโน ออนไลน์ สล็อต
เฮง เฮง คาสิโน

Leave a Reply

Your email address will not be published. Required fields are marked *