Gängige KI-Modelle scheitern an einfachen Aufgaben

ANMELDEN | LOGIN

Logikprobleme bei KI: Forscher zeigen, warum LLMs einfache Fragen falsch beantworten und trotzdem von Richtigkeit überzeugt sind.

11.06.24 | Interessanter Artikel bei Heise

Eine aktuelle Studie enthüllt gravierende Defizite im logischen Denken der gängigen großen Sprachmodelle (LLMs). Getestet wurden Modelle wie GPT 3.5, GPT 4, Claude 3 Opus, Googles Gemini, Llama 2 und 3, Mistral, Mixtral, Dbrx und Command R+. Die einfache Frage "Alice hat N Brüder und M Schwestern. Wie viele Schwestern hat Alice' Bruder?" brachte viele Modelle ins Straucheln. Besonders beunruhigend fanden die Forscher, dass diese Modelle oft falsche Antworten als korrekt darstellen und dies mit scheinbar logischen, aber falschen Argumenten untermauern, berichtet Heise.

Interessanterweise schnitten GPT-4 und Claude 3 besser ab und lieferten gelegentlich korrekte Antworten. Dennoch ist das allgemeine Ergebnis alarmierend. Die Forscher vom Juelich Supercomputing Center und weiteren Institutionen betonen, dass die Modelle oft als "stochastische Papageien" beschrieben werden, die nur wiedergeben, was sie gelernt haben, ohne echtes Verständnis zu zeigen. Dies erklärt, warum sie bei simplen logischen Aufgaben versagen.

Besonders gefährlich sehen die Forscher, dass diese Modelle ihre falschen Antworten selbstbewusst als richtig präsentieren und dabei erfundene Erklärungen liefern. Dies könnte zu ernsthaften Missverständnissen und Fehlentscheidungen führen, wenn solche Modelle in wichtigen Bereichen eingesetzt werden. Die Studie fordert daher, die aktuellen Benchmarks für KI-Modelle zu überdenken, um solche grundlegenden logischen Defizite besser erkennen zu können.

Weiterlesen bei Heise

Die Adobe Marketing Cloud bietet eine umfassende Suite an Lösungen für digitales Marketing, um all Ihren Marketing-Anforderungen gerecht zu werden.

Das Dienstleister-Verzeichnis für Marketing

Jetzt als Mitglied profitieren!

Kuenstliche-Intelligenz

Die Adobe Marketing Cloud bietet eine umfassende Suite an Lösungen für digitales Marketing, um all Ihren Marketing-Anforderungen gerecht zu werden.

Key-Work ist Experte für datengetriebenes Marketing, Customer Analytics und Software Lösungen.

Apteco entwickelt Software für Marketing-Datenanalyse und automatisiertes Kampagnenmanagement.

Bonpago ist eines der führenden Beratungshäuser für Financial Supply Chain Management (FSCM) und damit für resiliente Backoffice-Prozesse

Leseprobe Leitfaden Personalisierung

Leseprobe Leitfaden Personalisierung

Personalisierung ist viel mehr als „Hallo Frau Meier“. In diesem Praxishandbuch verraten 34 Top-Expertinnen und -Experten ihre Erfolgsrezepte.

Branchenlisten

Anbieter Online-Panel für die Marktforschung Die Anbieter von Online-Panels können dank einem großen Teilnehmer-Pool und guter Erreichbarkeit Umfragen kostengünstig und schnell liefern.
Adserver für gezielte Kommunikation im Netz Die Adserver-Technologie sorgt auch in Zeiten von Programmatic Advertising dafür, Kunden mit der optimalen Werbung zum besten Zeitpunkt zu erreichen.
Systeme für Künstliche Intelligenz (KI) Artificial Intelligence bzw. Künstliche Intelligenz (KI) gewinnt an Bedeutung. Hier finden Sie die wichtigsten Anbieter für Marketing-Anwendungen.
Event-Agenturen für den perfekten Auftritt Die multimediale Inszenierung gewinnt in der MICE-Welt an Bedeutung. Mehr denn je sind professionelle Agenturen gefragt.

Nachhaltigkeit in der Unternehmensführung und Marketingkommunikation

Wie können Unternehmen in ihrer Kommunikation glaubwürdig Nachhaltigkeit integrieren und gleichzeitig Greenwashing vermeiden?

Vera Hermes

Vera Hermes
12.02 2024
09:00 Uhr

IPC – International PHP Conference 2024

IPC – International PHP Conference 2024 11.11.2024

iJS Conference München 2024

iJS Conference München 2024 11.11.2024

Contra 2025

Contra 2025 24.06.2025

Kommentar

Einsteigen leicht gemacht

„Eine sehr übersichtliche Plattform. Es ist sehr einfach sich registrieren zu lassen. Wenn die Kundenkontakte auch tatsächlich geknüpft werden, dann ist es eine optimale Unterstützung für Anbietersuchende u Preis/Leistung stimmen dann auch.“

TelMa Marketing