IBM hat eine KI entwickelt, die sich in einer Debatte gegen Menschen behaupten kann

Diese Website kann Affiliate-Provisionen über die Links auf dieser Seite verdienen. Nutzungsbedingungen.

In den letzten Jahren hat sich die KI von einem Nischenthema zu einem explodierenden Feld entwickelt. KI kann die Audio- und Videoqualität verbessern, Standbilder von längst verstorbenen Menschen animieren und Sie anhand eines Analabdrucks identifizieren. Eine Sache, die es nicht konnte? Im Rahmen einer formellen Debatte effektiv argumentieren.

Um dieses Problem zu lösen, hat IBM Project Debater entwickelt, ein AI-Entwicklungsprogramm, das sich genau darauf konzentriert, wie es sich anhört. Viele KI-Projekte, insbesondere solche, die sich auf Spiele konzentrieren, haben einen klaren Gewinner und einen Verlierer, basierend auf der Bewertung numerischer Kriterien wie erbeutete Teile, verlorene Leben oder das Verhältnis zwischen Tötungen und Todesfällen. Um einen Menschen effektiv zu debattieren, sind ganz andere Fähigkeiten erforderlich.

Ein kürzlich veröffentlichtes Papier im Natur beschreibt die Ergebnisse eines Tests von 2019 zwischen Project Debater und dem weltweit anerkannten Debattiermeister Harish Natarajan. Die KI und der Einzelne diskutierten darüber, ob die Vorschule subventioniert werden sollte. Jede Seite erhielt 15 Minuten Vorbereitungszeit ohne zusätzlichen Internetzugang, mit dem Project Debater seine eigene interne Inhaltsdatenbank durchsuchte. Beide Seiten hielten eine vierminütige Rede, gefolgt von einer zweiminütigen Abschlusserklärung.

Letztendlich wurde beurteilt, dass Natarajan die Debatte gewonnen hat, aber Project Debater behauptete sich und bildete im Verlauf der Diskussion logische Aussagen und Argumente.

Die Forscher, die Project Debater entwickelt haben, können es nicht mit anderen Systemen dieser Art vergleichen. Es gibt keine. Stattdessen verwendeten sie PD, um eine einzelne Eröffnungsrede zu generieren und sie mit verschiedenen anderen Methoden zu vergleichen.

In der folgenden Grafik ist „Summit“ ein Zusammenfassungssystem mit mehreren Dokumenten, Speech-GPT2 ist ein „fein abgestimmtes Sprachmodell“ und Arg-GPT2 wurde mit verketteten Argumenten generiert. Arg-Search bezieht sich auf Reden, die mit ArgumenText extrahiert wurden. Arg-Human1 und Arg-Human2 beziehen sich auf einen hybriden Ansatz, bei dem das Argument-Mining-Modul von Project Debater neben der menschlichen Urheberschaft und Verifizierung getestet wurde. Schließlich wurden Reden von menschlichen Experten aufgenommen.

Die obige Grafik zeigt den Basiswert, wobei ein Wert von 5 “stark einverstanden” und ein Wert von 1 “stark nicht einverstanden” bedeutet. Die Leser wurden gebeten, die folgende Frage zu beantworten: „Diese Rede ist eine gute Eröffnungsrede für dieses Thema.“ Dieses Diagramm ist kein vollständiger Test der Fähigkeiten von Project Debater – es wertet nur Eröffnungsreden aus -, aber es zeigt, dass das System in der Lage ist, kohärente Argumente zu liefern. IBM hat eine Website für das Projekt mit Links zu Whitepaper, Podcast und der Debatte 2019 über Vorschulzuschüsse, wenn Sie mehr über die Leistung des Systems in Aktion erfahren möchten.

Die Frage, wer eine Debatte gewinnt, wird immer subjektiv sein, und die Menschen übertreffen den Project Debater von IBM immer noch deutlich. Im Moment sind wir noch weit von Data entfernt – aber wir sind auch weit von Eliza entfernt.

Jetzt lesen::

Leave a Reply

Your email address will not be published. Required fields are marked *