DeepMind AI löst schwierige Geometrieprobleme aus der Mathe-Olympiade

By | January 17, 2024

Bei geometrischen Problemen geht es darum, Fakten über Winkel oder Linien in komplizierten Formen zu beweisen

Google DeepMind

Eine Google DeepMind-KI kann einige Geometriefragen der International Mathematical Olympiad (IMO) fast so gut lösen wie die besten menschlichen Konkurrenten.

„Die Ergebnisse von AlphaGeometry sind atemberaubend und atemberaubend“, sagt Gregor Dolinar, Präsident von IMO. „Es sieht so aus, als würde KI die IMO-Goldmedaille viel früher gewinnen, als noch vor ein paar Monaten gedacht.“

IMO richtet sich an Schüler der Sekundarstufe und ist einer der schwierigsten Mathematikwettbewerbe der Welt. Die richtige Beantwortung von Fragen erfordert mathematische Kreativität, mit der KI-Systeme lange zu kämpfen hatten. GPT-4 zum Beispiel, das in anderen Bereichen bemerkenswerte Denkfähigkeiten gezeigt hat, erreicht meiner Meinung nach bei Geometriefragen 0 Prozent, während selbst erfahrene KIs Schwierigkeiten haben, so gut zu antworten wie durchschnittliche Konkurrenten.

Dies liegt zum Teil an der Schwierigkeit der Probleme, aber auch an fehlenden Trainingsdaten. Der Wettbewerb findet seit 1959 jährlich statt und jede Ausgabe besteht aus nur sechs Fragen. Einige der erfolgreichsten KI-Systeme erfordern jedoch Millionen oder Milliarden von Datenpunkten. Insbesondere geometrische Probleme, die eine oder zwei der sechs Fragen darstellen und bei denen es um den Nachweis von Fakten über Winkel oder Linien in komplizierten Formen geht, lassen sich besonders schwer in ein computerfreundliches Format übersetzen.

Thang Luong von Google DeepMind und seine Kollegen haben dieses Problem umgangen, indem sie ein Tool entwickelt haben, das Hunderte Millionen maschinenlesbare geometrische Beweise generieren kann. Als sie mithilfe dieser Daten eine KI namens AlphaGeometry trainierten und sie auf 30 IMO-Geometriefragen testeten, beantwortete sie 25 davon richtig, verglichen mit einer geschätzten Punktzahl von 25,9 für einen IMO-Goldmedaillengewinner basierend auf ihren Wettbewerbsergebnissen.

“Unser [current] KI-Systeme kämpfen immer noch mit der Fähigkeit, Dinge wie tiefes Denken zu leisten, bei denen wir viele, viele Schritte im Voraus planen und auch das Gesamtbild sehen müssen, weshalb Mathematik für uns ein so wichtiger Maßstab und Test auf unserer Suche ist künstliche allgemeine Intelligenz“, sagte Luong auf einer Pressekonferenz.

AlphaGeometry besteht aus zwei Teilen, die Luong mit verschiedenen Denksystemen im Gehirn vergleicht: einem schnellen, intuitiven System und einem langsameren, analytischeren System. Der erste intuitive Teil ist ein Sprachmodell, ähnlich der Technologie hinter ChatGPT, genannt GPT-f. Es wurde anhand von Millionen generierter Beweise trainiert und schlägt vor, welche Theoreme und Argumente als nächstes für ein Problem ausprobiert werden sollten. Sobald der nächste Schritt vorgeschlagen wird, verwendet ein langsamerer, aber sorgfältigerer Mechanismus des „symbolischen Denkens“ logische und mathematische Regeln, um das von GPT-f vorgeschlagene Argument vollständig zu konstruieren. Die beiden Systeme arbeiten dann abwechselnd zusammen, bis ein Problem gelöst ist.

Obwohl diese Methode bei der Lösung von IMO-Geometrieproblemen bemerkenswert erfolgreich ist, sind die Antworten, die sie generiert, tendenziell länger und weniger „schön“ als menschliche Beweise, sagt Luong. Es kann jedoch auch Dinge erkennen, die Menschen nicht bemerken. Beispielsweise wurde eine bessere, allgemeinere Lösung für eine IMO-Frage aus dem Jahr 2004 gefunden, als in den offiziellen Antworten aufgeführt war.

Die Lösung von IMO-Geometrieproblemen auf diese Weise ist beeindruckend, sagt Yang-Hui He vom London Institute of Mathematical Sciences, aber das System ist in der Mathematik, die es verwenden kann, von Natur aus begrenzt, da IMO-Probleme mithilfe der unten gelehrten Theoreme lösbar sein müssen. Die Erweiterung des mathematischen Wissens, auf das AlphaGeometry Zugriff hat, könnte das System verbessern oder ihm sogar dabei helfen, neue mathematische Entdeckungen zu machen, sagt er.

Es wäre auch interessant zu sehen, wie AlphaGeometry damit umgeht, nicht zu wissen, was bewiesen werden muss, da mathematische Erkenntnisse oft durch die Untersuchung von Theoremen ohne definierten Beweis gewonnen werden können, sagt He. „Wenn Sie Ihren Endpunkt nicht kennen, können Sie ihn in der Menge aller finden [mathematical] Pfade, ob es einen Satz gibt, der wirklich interessant und neu ist?“

Letztes Jahr kündigte das algorithmische Handelsunternehmen XTX Markets einen Preisfonds in Höhe von 10 Millionen US-Dollar für KI-Mathematikmodelle an, mit einem Hauptpreis von 5 Millionen US-Dollar für das erste öffentlich geteilte KI-Modell, das IMO-Gold gewinnen könnte, sowie kleineren Fortschrittspreisen für wichtige Meilensteine.

„Die Lösung eines IMO-Geometrieproblems ist einer der geplanten Fortschrittspreise, die vom AIMO Challenge Fund in Höhe von 10 Millionen US-Dollar unterstützt werden“, sagt Alex Gerko von XTX Markets. „Es ist aufregend zu sehen, wie wir diesem Ziel näher kommen, noch bevor wir die vollständigen Einzelheiten dieses Fortschrittspreises bekannt gegeben haben, zu dem auch die offene Zugänglichmachung des Modells und der Daten sowie die Lösung eines echten Geometrieproblems während eines Live-Wettbewerbs gehören würden. Ich lebe.“ von IMO.“

DeepMind wollte nicht sagen, ob AlphaGeometry an einem Live-IMO-Wettbewerb teilnehmen soll oder ob das System erweitert wird, um andere nicht auf Geometrie basierende IMO-Probleme zu lösen. DeepMind hat jedoch bereits an öffentlichen Wettbewerben zur Vorhersage der Proteinfaltung teilgenommen, um sein AlphaFold-System zu testen.

Themen:

Leave a Reply

Your email address will not be published. Required fields are marked *