Gemini lügt

Mein AI-Albtraum war “so doof wie Siri, aber noch geschwätziger.” Seit gestern habe ich einen neuen. “Völlig ahnungslos, aber sicher im Auftreten”.

Gestern wurde hier Fußball gespielt und ich konnte die Fan-Gesänge hören. Also habe ich Gemini (auf Android) mal gefragt, was es mir zum Spiel Darmstadt 98 gehen 1. FC Köln erzählen kann. Und das war leider falsch. Was soll ich mit einem ahnungslosen Schwätzer? Markus kommentierte: “So einen hatten wir alle schon als Projektkollegen.”

7 thoughts on “Gemini lügt”

    1. Beim Stand von 4:1 zu behaupten, das Spiel werde nochmal spannend… ist schon sehr „künstlich“, diese Intelligenz 😉

  1. Halb so schlimm: https://arxiv.org/abs/2406.04175

    »This finding reveals a tension in our usually dismissive understandings of confabulation. It suggests, counter-intuitively, that the tendency for LLMs to confabulate may be intimately associated with a positive capacity for coherent narrative-text generation.«

  2. Auch immer schön, das direkte Einknicken beim Korrigieren. Egal, worum es geht :))…

    1. Spätestens wenn die KI nicht mehr einknickt, ist der Touringtest bestanden. 🙂

      1. Das wird dann als nächstes nachtrainiert 🙂 Sind alles nur KI-Leugner und Querdenker, die meine Ergebnisse infrage stellen.

  3. Nicht verwunderlich bei Themen und Fragestellungen, die nicht im Trainingsdatensatz enthalten sind. Da wird dann ganz ungeniert halluziniert. Hab auf die Schnelle nichts zum Stand von Geminis Trainingsdatensatz gefunden. Bei OpenAI kannst Du in der Doku das Training Cut-Off Datum einsehen (https://platform.openai.com/docs/models/o1) . Es wäre schöner, wenn der Chatbot entsprechend antworten würde, dass er keine Antwort auf die Frage hat. Copilot zeigt Dir immerhin alle Quellen an, die in der generierten Antwort mit einbezogen wurden. Gemini und die anderen großen Sprachmodelle unterstützen aber Function Calling. Damit kann ich eine Funktion, die z. B. über eine API Daten zum Spielstand abruft, dem Modell bekannt machen. Somit kann ich in Echtzeit mit externen Datenquellen arbeiten.

Comments are closed.