AlphaZero

http://dbpedia.org/resource/AlphaZero

AlphaZero es un programa informático desarrollado por DeepMind, que utiliza un enfoque generalizado de AlphaGo Zero. El 5 de diciembre de 2017, el equipo de DeepMind lanzó una preimpresión presentando AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en ajedrez, shogi y Go al derrotar a los campeones del mundo, Stockfish, Elmo y la versión de 3 días de AlphaGo Zero en cada caso. AlphaZero dominó a Stockfish después de solo 4 horas de autoaprendizaje, sin acceso a o base de datos de tablas de finales. rdf:langString

AlphaZero est une version généraliste d’AlphaGo Zero, un logiciel de go (jeu de stratégie abstrait chinois) qui a été adapté pour jouer aux échecs et au shogi (échecs japonais). AlphaZero a été créé par Demis Hassabis de DeepMind, une entreprise appartenant au groupe Google. rdf:langString

AlphaZero（アルファゼロ）は、DeepMindによって開発されたコンピュータプログラムである。汎化されたAlphaGo Zeroのアプローチを使用している。 2017年12月5日、DeepMindチームはAlphaGo Zeroのアプローチを汎化したプログラムであるAlphaZeroの論文をarXiv上で発表した。AlphaZeroは、24時間以内にチェス、将棋、囲碁の世界チャンピオンプログラムであるStockfish、elmo、3日間学習させたAlphaGo Zeroを破るレベルに達した。具体的には、2時間で将棋、4時間でチェスの最高峰のAIに勝利し、AlphaGo Zeroも8時間で上回った。 AlphaZeroは、オープニングブック（序盤定跡データベース）とエンドゲームの表（終盤を解析したデータベース）を参照せずに、4時間の自己対戦だけでStockfishを凌駕した。それまでチェスおよび将棋のAIで一般的であったアルファ・ベータ探索ではなく、囲碁AIで成功を収めたモンテカルロ木探索（モンテカルロ法の応用）とディープラーニングをこれらのゲームに対して適用しても強いAIが作れることを実証した。 rdf:langString

AlphaZero — нейронная сеть, разработанная компанией DeepMind, которая использует обобщённый подход AlphaGo Zero. 5 декабря 2017 года коллектив DeepMind выпустил препринт программы AlphaZero, которая после тренировки в течение 24 часов смогла победить чемпионов мира среди программ по играм в шахматы, сёги и го (Stockfish, Elmo и трехдневный вариант AlphaGo Zero соответственно). Таким образом, в настоящее время искусственный интеллект AlphaZero является сильнейшей из всех программ для игр в сёгу и го. В шахматы силу AlphaZero нельзя оценить на данный момент, по причине нехватки партий, они не игрались с 2017 года. rdf:langString

AlphaZero是DeepMind所開發的人工智能軟體。 rdf:langString

AlphaZero — це комп'ютерна програма, розроблена компанією DeepMind, яка використовує узагальнений підхід . 5 грудня 2017 року колектив DeepMind випустив препринтне введення AlphaZero, яке впродовж 24 годин досягнуло надлюдського рівня гри в шахи, Сьоґі, і ґо, перемігши чемпіонів світу серед програм, Stockfish, Elmo і 3-денний варіант AlphaGo Zero в кожному випадку, використовуючи краще комп'ютерне обладнання відносно своїх опонентів. AlphaZero переміг Stockfish 8 (рушій грав без доступу до та ендшпільних таблиць) граючи з кращим комп'ютерним обладнанням виділеним для AlphaZero. rdf:langString

ألفازيرو أو ألفا زيرو (بالإنجليزية: AlphaZero)‏ هو برنامج حاسوب طورته شركة ديب مايند المتخصصة في أبحاث الذكاء الاصطناعي من أجل إتقان ألعاب الشطرنج والشوغي وغو. وتستخدم خوارزميته منهجا مماثلا لمنهج . أصدر فريق ديب مايند في 5 ديسمبر 2017 مطبوعة أولية عرّف فيها عن ألفازيرو، الذي حقق بعد 24 ساعة من التدريب مستوى لعب فاق مستوى البشر في هذه الألعاب الثلاثة وذلك بهزيمة البرامج أبطال العالم وإلمو ونسخة 3 أيام من ألفاغو زيرو. استخدم ألفازيرو في كل حالة (TPUs) مخصصة كانت برامج غوغل قد أُمثِلت لاستخدامها. تدرب ألفازيرو عبر «اللعب مع الذات» فقط باستخدام 5000 وحدة معالجة موتر من الجيل الأول لتوليد المباريات و64 وحدة معالجة موتر من الجيل الثاني لتدريب الشبكات العصبية، كل هذا بالتوازي مع عدم الوصول إلى كتب الافتتاحيات أو جداول نهاية اللعب. بعد أربع ساعات من التدريب، قدَّرت ديب مايند أن ألفازيرو كان rdf:langString

AlphaZero is a computer program developed by artificial intelligence research company DeepMind to master the games of chess, shogi and go. This algorithm uses an approach similar to AlphaGo Zero. On December 5, 2017, the DeepMind team released a preprint introducing AlphaZero, which within 24 hours of training achieved a superhuman level of play in these three games by defeating world-champion programs Stockfish, elmo, and the three-day version of AlphaGo Zero. In each case it made use of custom tensor processing units (TPUs) that the Google programs were optimized to use. AlphaZero was trained solely via self-play using 5,000 first-generation TPUs to generate the games and 64 second-generation TPUs to train the neural networks, all in parallel, with no access to opening books or endgame t rdf:langString

AlphaZero ist ein autodidaktisches Computerprogramm von DeepMind, dessen Algorithmus mehrere komplexe Brettspiele einzig anhand der Spielregeln und Siegbedingungen sowie durch intensives Spielen gegen sich selbst erlernt. Das Programm verwendet einen verallgemeinerten Ansatz von AlphaGo Zero und beherrscht nach entsprechendem Training nicht nur Go, sondern auch die Strategiespiele Schach und Shōgi. rdf:langString

AlphaZero è un algoritmo di intelligenza artificiale basato su tecniche di apprendimento automatico sviluppato da Google DeepMind. È una generalizzazione di AlphaGo Zero, predecessore sviluppato specificamente per il gioco del go e a sua volta evoluzione di AlphaGo, primo software capace di raggiungere prestazioni sovrumane nel gioco del go. Analogamente ad AlphaGo Zero, impiega la ricerca ad albero Monte Carlo (MCTS) guidata da una rete neurale convoluzionale profonda addestrata per rinforzo. rdf:langString

알파제로(AlphaZero)는 인간이 이룩한 지식의 도움 없이 독학으로 바둑, 체스, 쇼기(일본 장기) 등을 독파한 구글의 인공지능(AI)이다. 구글 딥마인드의 최고경영자(CEO)인 데미스 허사비스 등의 13명의 연구자들이 논문 <자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘>을 과학 학술지 《사이언스》2018년 12월 7일자에 발표하면서 알파 제로의 등장을 알렸다. rdf:langString

rdfs:label

rdf:langString ألفازيرو

rdf:langString AlphaZero

rdf:langString 알파제로

rdf:langString AlphaZero

dbpedia-owl:wikiPageID

xsd:integer 55981499

dbpedia-owl:wikiPageRevisionID

xsd:integer 1115199027

dbpedia-owl:abstract

rdf:langString ألفازيرو أو ألفا زيرو (بالإنجليزية: AlphaZero)‏ هو برنامج حاسوب طورته شركة ديب مايند المتخصصة في أبحاث الذكاء الاصطناعي من أجل إتقان ألعاب الشطرنج والشوغي وغو. وتستخدم خوارزميته منهجا مماثلا لمنهج . أصدر فريق ديب مايند في 5 ديسمبر 2017 مطبوعة أولية عرّف فيها عن ألفازيرو، الذي حقق بعد 24 ساعة من التدريب مستوى لعب فاق مستوى البشر في هذه الألعاب الثلاثة وذلك بهزيمة البرامج أبطال العالم وإلمو ونسخة 3 أيام من ألفاغو زيرو. استخدم ألفازيرو في كل حالة (TPUs) مخصصة كانت برامج غوغل قد أُمثِلت لاستخدامها. تدرب ألفازيرو عبر «اللعب مع الذات» فقط باستخدام 5000 وحدة معالجة موتر من الجيل الأول لتوليد المباريات و64 وحدة معالجة موتر من الجيل الثاني لتدريب الشبكات العصبية، كل هذا بالتوازي مع عدم الوصول إلى كتب الافتتاحيات أو جداول نهاية اللعب. بعد أربع ساعات من التدريب، قدَّرت ديب مايند أن ألفازيرو كان يلعب الشطرنج بتصنييف إيلو أكبر من ستوكفيش 8، وبعد تسع ساعات من التدريب هزمت الخوارزميةُ ستوكفيش 8 في مقابلة موقتة من 100 مباراة (28 فوز، 0 خسارة و72 تعادل). لعبت خوارزمية ألفازيرو المدربة على آلة وحيدة تملك أربع وحدات معالجة موتر. نُشرت الورقة العلمية الخاصة بألفازيرو من قبل ديب مايند في دورية ساينس في 7 ديسمبر 2018. وفي 2019 نشرت ديب مايند ورقة جديدة تعطي تفاصيلا حول وهي خوارزمية جديدة قادرة على تعميم عمل ألفازيرو، بحيث تلعب كلًّا من ألعاب آتاري وألعاب الرقعة من دون معرفة مسبقة باللعبة أو قوانينها.

rdf:langString AlphaZero és un programa informàtic desenvolupat per DeepMind, que utilitza un enfocament generalitzat d'AlphaGo Zero. El 5 de desembre de 2017, l'equip de DeepMind va llançar una preimpressió presentant AlphaZero, que va aconseguir en 24 hores un nivell de joc sobrehumà en escacs, shogi i Go en derrotar els campions del món, Stockfish, Elmo i la versió de 3 dies d'AlphaGo Zero en cada cas. AlphaZero va dominar Stockfish després de només 4 hores d'autoaprenentatge, sense accés a llibres d'obertura o base de dades de taules de finals.

rdf:langString AlphaZero is a computer program developed by artificial intelligence research company DeepMind to master the games of chess, shogi and go. This algorithm uses an approach similar to AlphaGo Zero. On December 5, 2017, the DeepMind team released a preprint introducing AlphaZero, which within 24 hours of training achieved a superhuman level of play in these three games by defeating world-champion programs Stockfish, elmo, and the three-day version of AlphaGo Zero. In each case it made use of custom tensor processing units (TPUs) that the Google programs were optimized to use. AlphaZero was trained solely via self-play using 5,000 first-generation TPUs to generate the games and 64 second-generation TPUs to train the neural networks, all in parallel, with no access to opening books or endgame tables. After four hours of training, DeepMind estimated AlphaZero was playing chess at a higher Elo rating than Stockfish 8; after nine hours of training, the algorithm defeated Stockfish 8 in a time-controlled 100-game tournament (28 wins, 0 losses, and 72 draws). The trained algorithm played on a single machine with four TPUs. DeepMind's paper on AlphaZero was published in the journal Science on 7 December 2018. However, the AlphaZero program itself has not been made available to the public. In 2019 DeepMind published a new paper detailing MuZero, a new algorithm able to generalise AlphaZero's work, playing both Atari and board games without knowledge of the rules or representations of the game.

rdf:langString AlphaZero ist ein autodidaktisches Computerprogramm von DeepMind, dessen Algorithmus mehrere komplexe Brettspiele einzig anhand der Spielregeln und Siegbedingungen sowie durch intensives Spielen gegen sich selbst erlernt. Das Programm verwendet einen verallgemeinerten Ansatz von AlphaGo Zero und beherrscht nach entsprechendem Training nicht nur Go, sondern auch die Strategiespiele Schach und Shōgi. Am 5. Dezember 2017 veröffentlichte DeepMind, eine Forschungseinrichtung für Künstliche Intelligenz und Tochterunternehmen von Alphabet Inc., ein Preprint auf ArXiv über das Programm AlphaZero, in dem beschrieben wird, dass AlphaZero innerhalb von 24 Stunden durch bestärkendes Lernen eine überragende Spielstärke erreichte und die leistungsstärksten Programme Stockfish, Elmo und eine Drei-Tages-Version von AlphaGo Zero in ihren jeweiligen Disziplinen besiegte, dabei jedoch leistungsfähigere Hardware als die Gegnerprogramme verwendete. Mit dem Dokument wurden lediglich zehn Gewinnpartien von AlphaZero gegen Stockfish veröffentlicht. Alle weiteren Partien sowie auch AlphaZero selbst waren zunächst nicht zugänglich und die Ergebnisse des Dokuments nicht durch ein Peer-Review verifiziert. Eine erweiterte und begutachtete Version des Artikels erschien am 7. Dezember 2018 in der Zeitschrift Science. AlphaZero schlug das freie Schachprogramm Stockfish 8 nach neun Stunden Selbstlernen. Für das Anlernen des künstlichen neuronalen Netzwerks wurden 64 Tensor Processing Units (TPU) der zweiten Generation verwendet. Weitere 5.000 TPUs der ersten Generation wurden für das Erzeugen der dazu notwendigen Trainingspartien eingesetzt. Der Algorithmus mit dem trainierten neuronalen Netzwerk spielte dann auf einem einzigen Computer mit lediglich vier TPUs.

rdf:langString AlphaZero es un programa informático desarrollado por DeepMind, que utiliza un enfoque generalizado de AlphaGo Zero. El 5 de diciembre de 2017, el equipo de DeepMind lanzó una preimpresión presentando AlphaZero, que logró en 24 horas un nivel de juego sobrehumano en ajedrez, shogi y Go al derrotar a los campeones del mundo, Stockfish, Elmo y la versión de 3 días de AlphaGo Zero en cada caso. AlphaZero dominó a Stockfish después de solo 4 horas de autoaprendizaje, sin acceso a o base de datos de tablas de finales.

rdf:langString AlphaZero est une version généraliste d’AlphaGo Zero, un logiciel de go (jeu de stratégie abstrait chinois) qui a été adapté pour jouer aux échecs et au shogi (échecs japonais). AlphaZero a été créé par Demis Hassabis de DeepMind, une entreprise appartenant au groupe Google.

rdf:langString AlphaZero（アルファゼロ）は、DeepMindによって開発されたコンピュータプログラムである。汎化されたAlphaGo Zeroのアプローチを使用している。 2017年12月5日、DeepMindチームはAlphaGo Zeroのアプローチを汎化したプログラムであるAlphaZeroの論文をarXiv上で発表した。AlphaZeroは、24時間以内にチェス、将棋、囲碁の世界チャンピオンプログラムであるStockfish、elmo、3日間学習させたAlphaGo Zeroを破るレベルに達した。具体的には、2時間で将棋、4時間でチェスの最高峰のAIに勝利し、AlphaGo Zeroも8時間で上回った。 AlphaZeroは、オープニングブック（序盤定跡データベース）とエンドゲームの表（終盤を解析したデータベース）を参照せずに、4時間の自己対戦だけでStockfishを凌駕した。それまでチェスおよび将棋のAIで一般的であったアルファ・ベータ探索ではなく、囲碁AIで成功を収めたモンテカルロ木探索（モンテカルロ法の応用）とディープラーニングをこれらのゲームに対して適用しても強いAIが作れることを実証した。

rdf:langString AlphaZero è un algoritmo di intelligenza artificiale basato su tecniche di apprendimento automatico sviluppato da Google DeepMind. È una generalizzazione di AlphaGo Zero, predecessore sviluppato specificamente per il gioco del go e a sua volta evoluzione di AlphaGo, primo software capace di raggiungere prestazioni sovrumane nel gioco del go. Analogamente ad AlphaGo Zero, impiega la ricerca ad albero Monte Carlo (MCTS) guidata da una rete neurale convoluzionale profonda addestrata per rinforzo. Il 5 dicembre 2017 il team DeepMind ha pubblicato su arXiv un preprint nel quale vengono presentati alcuni risultati ottenuti da AlphaZero in diversi giochi da tavolo classici, raggiungendo con poche ore di training un livello sovrumano nel gioco degli scacchi, shōgi e go, superando la forza di gioco di programmi campioni del mondo nelle rispettive discipline: Stockfish per gli scacchi e elmo/yaneura ou per lo shogi (entrambi motori basati su algoritmi tradizionali, ovvero ricerca ad albero con potatura alfa-beta), e AlphaGo Zero per il go. In particolare, un'istanza di AlphaZero ha vinto un match di 100 partite contro Stockfish, ottenendo 25 vittorie con il bianco, 3 con il nero, e patta nel resto delle partite. Gli autori stimano che AlphaZero abbia superato la forza di gioco di Stockfish dopo le prime quattro ore di addestramento (circa 300 000 mini-batch). La versione definitiva dell'articolo è stata pubblicata su Science nel numero di dicembre 2018.

rdf:langString 알파제로(AlphaZero)는 인간이 이룩한 지식의 도움 없이 독학으로 바둑, 체스, 쇼기(일본 장기) 등을 독파한 구글의 인공지능(AI)이다. 구글 딥마인드의 최고경영자(CEO)인 데미스 허사비스 등의 13명의 연구자들이 논문 <자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘>을 과학 학술지 《사이언스》2018년 12월 7일자에 발표하면서 알파 제로의 등장을 알렸다. 알파 제로는 기보(바둑이나 장기를 둔 내용의 기록) 학습 없이 알파고(AlphaGo)를 상대로 전승을 거둔 (AlphaGo Zero)의 범용 버전으로, 명칭에서 바둑을 뜻하는 고(GO)를 빼 범용 인공지능임을 표시했다. 게임 법칙만 알면 모든 보드게임을 익힐 수 있어 바둑에 특화된 알파고를 압도한다고 평가된다. 알파제로는 2016년 체스 AI 챔피언인 스톡피시를 4시간 만에, 2017년 쇼기 AI 챔피언 엘모를 2시간 만에 꺾었다. 스톡피시와 엘모는 입력된 빅데이터를 기반으로 최적의 수를 검색하는 반면, 알파 제로는 인간의 두뇌처럼 심층신경망 기술을 통해 데이터를 스스로 학습하고 승률을 높이는 좋은 수를 찾아낸다. 바둑에서도 이세돌 9단과 대국을 벌였던 알파고 리(Lee)를 이겼고, 30시간 만에 알파고 제로도 추월하는 성능을 가졌다.

rdf:langString AlphaZero — нейронная сеть, разработанная компанией DeepMind, которая использует обобщённый подход AlphaGo Zero. 5 декабря 2017 года коллектив DeepMind выпустил препринт программы AlphaZero, которая после тренировки в течение 24 часов смогла победить чемпионов мира среди программ по играм в шахматы, сёги и го (Stockfish, Elmo и трехдневный вариант AlphaGo Zero соответственно). Таким образом, в настоящее время искусственный интеллект AlphaZero является сильнейшей из всех программ для игр в сёгу и го. В шахматы силу AlphaZero нельзя оценить на данный момент, по причине нехватки партий, они не игрались с 2017 года.

rdf:langString AlphaZero是DeepMind所開發的人工智能軟體。

rdf:langString AlphaZero — це комп'ютерна програма, розроблена компанією DeepMind, яка використовує узагальнений підхід . 5 грудня 2017 року колектив DeepMind випустив препринтне введення AlphaZero, яке впродовж 24 годин досягнуло надлюдського рівня гри в шахи, Сьоґі, і ґо, перемігши чемпіонів світу серед програм, Stockfish, Elmo і 3-денний варіант AlphaGo Zero в кожному випадку, використовуючи краще комп'ютерне обладнання відносно своїх опонентів. AlphaZero переміг Stockfish 8 (рушій грав без доступу до та ендшпільних таблиць) граючи з кращим комп'ютерним обладнанням виділеним для AlphaZero.

dbpedia-owl:wikiPageLength

xsd:nonNegativeInteger 22447

dcterms:subject

dbpedia:Category:Applications_of_artificial_intelligence

dbpedia:Category:Google

dbpedia:Category:Applied_machine_learning

dbpedia:Category:2017_in_go

dbpedia:Category:AlphaGo

dbpedia:Category:Chess_engines

dbpedia:Category:Go_engines

dbpedia:Category:Shogi_software

dbpedia:Category:2017_in_chess