บัญชีดำของเกมที่ชนะเกมในต่างประเทศของจีนดูเหมือนจะขยายตัวมากขึ้น

AI Poker Bot Pluribus ชนะ NLHE Multiplayer ที่ดีที่สุด มีค่าใช้จ่ายเพียง 144 เหรียญในการเปิดตัว



ในปี 2560 นักวิจัยกลุ่มเดียวกันจาก Libratus ได้พัฒนาบอทผู้เล่นโป๊กเกอร์แบบใหม่ซึ่งคราวนี้เอาชนะทีมผู้เล่นโป๊กเกอร์ที่ดีที่สุดในเกม NLHE 6 มือได้สำเร็จ Facebook ได้ร่วมมือกับนักวิจัยจากมหาวิทยาลัย Carnegie Mellon ซึ่งนำโดยศาสตราจารย์ Thomas Sandholm CMU และ Noam Brown นักศึกษาปริญญาเอกของเขาวางแผนจัดนิทรรศการที่มีซูเปอร์คอมพิวเตอร์ AI เวอร์ชันล่าสุดที่เรียกว่า Pluribus vs. Best Industry ผู้เล่น: և ผลการวิจัยที่ตีพิมพ์ในวารสาร Science เมื่อต้นเดือนนี้น่าทึ่งมาก บอทสามารถเอาชนะคู่ต่อสู้ของเขาซึ่งไม่มี AI มาก่อน (โปรแกรม AI ในอดีตสามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) ผลของโครงการนี้คาดว่าจะมีผลกระทบอย่างมากต่อการวิจัย AI ของเกมโป๊กเกอร์เอง การทดลองทั้งสองถือเป็นเกมที่รวบรวมความท้าทายของข้อมูลที่ซ่อนอยู่ได้ดีนักวิจัยจึงใช้มันเป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามไม่มีเครื่องจักรใดที่สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ได้อย่างแท้จริงในการตั้งค่าแบบไม่ จำกัด ของผู้เล่นหลายคนของ Texas Hold’em (มาตรวัดโป๊กเกอร์ที่พบมากที่สุด) ก่อนการถือกำเนิดของ Pluribus Pluribus แข่งขันกับฝั่งโป๊กเกอร์ที่ดีที่สุดโดยมีคะแนนสูงสุด 6 NLHE ข้อดีคือผู้เชี่ยวชาญ 6 อันดับแรกที่ได้รับรางวัลอย่างน้อย 1 ล้านดอลลาร์ในอาชีพโป๊กเกอร์มืออาชีพ พลูริบัสผ่านการทดสอบที่แตกต่างกันสองครั้ง ในการทดลองครั้งแรกคน 5 คน և หนึ่ง AI (5H + 1AI) ต่อสู้กันเองและในการทดลองครั้งที่สองมีเพียงคนเดียวที่พบร่างโคลน Pluribus 5 ตัว (1H + 5AI) เนื่องจากบอทไม่ได้รับอนุญาตให้สื่อสารพวกเขาทำ ไม่รู้ว่าพวกเขากำลังเล่นกับใครจึงทำให้ไม่ให้ความร่วมมือ ผลการทดลองทั้งสองครั้งแสดงให้เห็นว่าอัตราการชนะของ Pluribus นั้นสูงกว่าการเล่นโป๊กเกอร์ของมนุษย์อย่างมีนัยสำคัญ ผู้เล่นที่เข้าร่วมการซ้อม ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, ob Jacob Tull, ason Eason Les, my imi Chow, Linus Loeliger, Michael Gagliano, Nick Petrangello, Sean Rouen และ Seth Davis ใช้ชื่อเล่นระหว่างเกม ในระหว่างการซ้อม 5H + 1AI มีการเล่นทั้งหมด 10,000 มือใน 12 วันในขณะที่ในการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์คาร์เรนอีเลียสและคริสเฟอร์กูสันเล่น 5,000 มือต่อการทำซ้ำพลูริบัสห้าครั้ง เมื่อผลปรากฏออกมาว่าบอทสามารถเอาชนะผู้คนได้ในราคา $ 5 մեկ $ 1,000 ต่อชั่วโมงตามบล็อก Facebook AI ของ Noam Brown การแสดงวิดีโอของ Pluribus vs pro ผู้เชี่ยวชาญโป๊กเกอร์คิดอย่างไรเกี่ยวกับ AI Pluribus นี่คือสิ่งที่นักทดลองพูดถึงบอทโป๊กเกอร์ล่าสุด เซ ธ เดวิส “สิ่งที่สร้างแรงจูงใจที่สุดในเกมกับพลูริบัสคือการตอบสนองต่อกลยุทธ์ก่อนบลัฟที่ซับซ้อนของเขา ไม่เหมือนกับมนุษย์ Pluribus ใช้การเพิ่มขนาดพรีฟล็อปหลายเท่า การพยายามตอบสนองต่อพื้นที่เปิดโล่งที่ไม่ใช่เชิงเส้นเป็นความท้าทายที่น่าสนุกซึ่งแตกต่างจากเกมของมนุษย์” Ason Eyson Les. “ มันเป็นมอนสเตอร์บลัฟแน่นอน ฉันจะบอกว่ามันเป็นการหลอกลวงที่มีประสิทธิภาพมากกว่าคนส่วนใหญ่ และนั่นคือสิ่งที่ทำให้ยากที่จะเล่นกับมัน คุณมักจะมีความกดดันมากมายที่ทำให้คุณรู้ว่ามีโอกาสมากที่อาจจะเกิดปัญหาขึ้นที่นี่” จิมมายโชว “เมื่อฉันเล่นบ็อตฉันรู้สึกเหมือนได้รับสิ่งใหม่ ๆ เข้ามาในเกมของฉัน ในฐานะมนุษย์ฉันคิดว่าเรามีแนวโน้มที่จะทำให้เกมง่ายขึ้นด้วยการทำให้เป็นกลยุทธ์ที่ง่ายขึ้นในการนำมาใช้และจดจำ บอทไม่ใช้ทางลัดใด ๆ เหล่านี้ แต่มีโครงสร้างเกมที่ซับซ้อน / สมดุลมากเกินไปสำหรับการตัดสินใจแต่ละครั้ง” คริสเฟอร์กูสัน “ พลูริบัสเป็นคู่ต่อสู้ที่ยากมาก ยากที่จะวางลงบนมือทุกประเภท เขายังเก่งมากในการเดิมพันบาง ๆ ที่แม่น้ำ เขาดึงคุณค่าจากความดีของเขาได้ดีมาก มือ “: Darren Elias “มันเป็นแค่ฉัน և จากนั้นบอทโป๊กเกอร์ AI ห้าเวอร์ชันนี้ซึ่งฉันจะเล่นทุกวันเป็นพัน ๆ มือ มันพัฒนาขึ้นอย่างรวดเร็วโดยที่จากผู้เล่นระดับปานกลางกลายเป็นระดับโลกเป็นหลัก ระหว่างวันացողสัปดาห์ของการเล่นโป๊กเกอร์ ซึ่งค่อนข้างแย่มาก” มีความปลอดภัยที่จะกล่าวได้ว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดในโลกไม่มีหน้าโป๊กเกอร์ นิวเคลียสของพลูริบัสหรือกลยุทธ์การออกแบบถูกสร้างขึ้นเพื่อแข่งขันกับตัวเกมหรือโคลนของตัวเอง นี่เป็นวิธีการเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมเครือข่ายประสาทเทียม 5 เครือข่ายที่ฝึกฝนมาเป็นเวลา 45,000 ปีเพื่อเอาชนะทีม Pro Sport ในวิดีโอเกม Dota 2 Pluribus สอนตัวเองตั้งแต่เริ่มต้นโดยใช้การฝึกอบรมการเสริมกำลังเช่นเดียวกับ Go AI ของ DeepMind ที่ใช้ AlphaZero เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและปรับปรุงเมื่อตัดสินว่ากิจกรรมใดชนะเงินมากที่สุด หลังจากแต่ละมือจะจำได้ว่ามันเล่นอย่างไร և สงสัยว่ามันจะทำเงินได้มากขึ้นจากการกระทำต่างๆหรือไม่เช่นการเก็บรวบรวมแทนที่จะอยู่กับการเดิมพัน หากทางเลือกอื่นทำงานได้ดีกว่าก็มีแนวโน้มที่จะเลือกสิ่งเหล่านั้นในอนาคต การเล่นโป๊กเกอร์มือนับล้านล้านกับเขา Pluribus ได้คิดค้นกลยุทธ์พื้นฐานที่เขาแสวงหาในเกม สำหรับทุกการตัดสินใจของเขา Pluribus จะเปรียบเทียบสถานะของเกมกับโปรเจ็กต์ของเขาคาดการณ์ล่วงหน้าสองสามขั้นตอนเพื่อดูว่าเกมจะดำเนินไปอย่างไร จากนั้นจะตัดสินว่าสามารถปรับปรุงได้หรือไม่ ด้วยการเรียนรู้ด้วยตนเองโดยปราศจากการแทรกแซงของมนุษย์ Pluribus ใช้กลยุทธ์หลายอย่างที่นักพนันที่เป็นมนุษย์ไม่เคยคิด ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากประสิทธิภาพ เมื่อเล่นโป๊กเกอร์มันจะทำงานบนซีพียู (โปรเซสเซอร์) เพียงสองตัวซึ่งตรงข้ามกับโปรเซสเซอร์ 100 ตัวของ Libratus և Go bot ดั้งเดิมของ DeepMind ซึ่งใช้โปรเซสเซอร์เกือบ 2,000 ตัวเมื่อมืออาชีพชั้นนำพ่ายแพ้เป็นครั้งแรก เมื่อพลูริบัสเล่นกันเองมันจะเล่นมือใน 20 วินาทีเร็วกว่าผู้เล่นมืออาชีพประมาณสองเท่า สิ่งที่ยอดเยี่ยมอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ที่มีราคาเพียง 144 เหรียญในการทำงาน สำหรับการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านดอลลาร์ซึ่งมีราคาแพงมากในการใช้งาน แน่นอนว่าประสบการณ์นี้ไม่ได้จบลงด้วยโป๊กเกอร์ แม้ว่าการเอาชนะโป๊กเกอร์ที่ดีที่สุดของมนุษย์ในเกมหกมืออาจเป็นความสำเร็จที่ยอดเยี่ยม แต่ก็แสดงให้เห็นว่าความสามารถในการใช้คอมพิวเตอร์ของเขาอาจมีจุดประสงค์ที่แตกต่างจากการเล่นไพ่ ผลการวิจัยยืนยันความจริงที่ว่า AI สามารถทำงานได้ในระดับ “เหนือมนุษย์” ในหลาย ๆ เรื่องսահմանափสถานการณ์การเข้าถึงข้อมูลที่ จำกัด և และอาจใช้ในกลยุทธ์การเจรจาต่อรองเพื่อการลงทุนวาณิชธนกิจไปจนถึงเทคโนโลยีเครื่องจักรที่ควบคุมตนเองได้ ตอนนี้ Pluribus เข้าร่วมซีรีส์เกมเช่น Chess և Go สองเกมที่ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกพ่ายแพ้ด้วยปัญญาประดิษฐ์ ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


หวยออนไลน์
เล่นหวยออนไลน์
ไพ่ออนไลน์
เว็บ คาสิโน
คาสิโน777