this post was submitted on 01 Jun 2026
75 points (97.5% liked)

ich_iel

4793 readers
319 users here now

Die offizielle Zweigstelle von ich_iel im Fediversum.

Alle Pfosten müssen den Titel 'ich_iel' haben, der Unterstrich darf durch ein beliebiges Symbol oder Bildschriftzeichen ersetzt werden. Ihr dürft euch frei entfalten!


Matrix


📱 Empfohlene Schlaufon-Applikationen für Lassmich


Befreundete Kommunen:

!wir_iel@feddit.org

!i_itrl@feddit.org

!ich_ial@lemmy.world

!zunftgemeinde@feddit.org

!ki_iel@feddit.org


Sonstiges:

Zangendeutsch-Wörterbuch


Regeln:

1. Seid nett zueinander

Diskriminierung anderer Benutzer, Beleidigungen und Provokationen sind verboten.

2. Pfosten müssen den Titel 'ich_iel' oder 'ich iel' haben

Nur Pfosten mit dem Titel 'ich_iel' oder 'ich iel' sind zugelassen. Alle anderen werden automatisch entfernt.

Unterstrich oder Abstand dürfen durch ein beliebiges Textsymbol oder bis zu drei beliebige Emojis ersetzt werden.

3. Keine Hochwähl-Maimais oder (Eigen)werbung

Alle Pfosten, die um Hochwählis bitten oder Werbung beinhalten werden entfernt. Hiermit ist auch Eigenwerbung gemeint, z.b. für andere Gemeinschaften.

4. Keine Bildschirmschüsse von Unterhaltungen

Alle Pfosten, die Bildschirmschüsse von Unterhaltungen, wie beispielsweise aus WasistApplikaton oder Zwietracht zeigen, sind nicht erlaubt. Hierzu zählen auch Unterhaltungen mit KIs.

5. Keine kantigen Beiträge oder Meta-Beiträge

ich_iel ist kein kantiges Maimai-Brett. Meta-Beiträge, insbesondere über gelöschte oder gesperrte Beiträge, sind nicht erlaubt.

6. Keine Überfälle

Wer einen Überfall auf eine andere Gemeinschaft plant, muss diesen zuerst mit den Mods abklären. Brigadieren ist strengstens verboten.

7. Keine Ü40-Maimais

Maimais, die es bereits in die WasistApplikation-Familienplauderei geschafft haben oder von Rüdiger beim letzten Stammtisch herumgezeigt wurden, sind besser auf /c/ichbin40undlustig aufgehoben.

8. ich_iel ist eine humoristische Plattform

Alle Pfosten auf ich_iel müssen humorvoll gestaltet sein. Humor ist subjektiv, aber ein Pfosten muss zumindest einen humoristischen Anspruch haben. Die Atmosphäre auf ich_iel soll humorvoll und locker gehalten werden.

9. Keine Polemik, keine Köderbeiträge, keine Falschmeldungen

Beiträge, die wegen Polemik negativ auffallen, sind nicht gestattet. Desweiteren sind Pfosten nicht gestattet, die primär Empörung, Aufregung, Wut o.Ä. über ein (insbesonders, aber nicht nur) politisches Thema hervorrufen sollen. Die Verbreitung von Falschmeldungen ist bei uns nicht erlaubt.


Bitte beachtet auch die Regeln von Feddit.org

founded 2 years ago
MODERATORS
 
all 31 comments
sorted by: hot top controversial new old
[–] aaaaaaaaargh@feddit.org 39 points 1 day ago

Hab es auch ausprobiert und es wurde Kunst.

[–] DmMacniel@feddit.org 23 points 1 day ago (1 children)

Tja Schachmatt liebe Konservativen, euer Maschinengott hat ja zur 4 Tage Woche gesagt!

[–] rbn@sopuli.xyz 3 points 1 day ago

Aber leider nur 3 einzelne freie Tage. Weniger zersplittert wäre mir lieber.

[–] viertesauge@feddit.org 15 points 1 day ago

Aber wie viele H's hat Habicht?

[–] KraeuterRoy@feddit.org 6 points 22 hours ago* (last edited 22 hours ago)

Kein Wunder, dass es so ein schlechtes Ergebnis gibt. Du hast vergessen "Bitte nicht halluzinieren!" in den Prompt zu schreiben!

Einmal mehr sitzt das Problem vor dem Bildschirm!1elf

[–] jgjl@discuss.tchncs.de 15 points 1 day ago (2 children)

Also Le Mistral Vibe ist direkt gestorben:

[–] ennof@feddit.org 2 points 16 hours ago (1 children)

Ja, Le Chat (Vibe) is grade kaputt.

[–] jgjl@discuss.tchncs.de 1 points 15 hours ago

Bei mir geht’s wieder und gibt sogar die richtige Antwort :)

[–] jokro@feddit.org 3 points 1 day ago

Bei mir auch, aber auch bei anderen Fragen, scheint gerade kaputt

[–] dangrousperson@feddit.org 13 points 1 day ago* (last edited 1 day ago) (1 children)

Offensichtlich hat Dienstag zwei t's und nur Mittwoch hat keine

Google AI kann es auch nicht

edit: liegt wahrscheinlich daran, dass er einen Facebook Post als 'Quelle' gefunden hat wo es Middwoch heißt

[–] KraeuterRoy@feddit.org 3 points 21 hours ago

Na wenn es in einer x-beliebigen Pfostierung auf Fratzenbuch steht, muss es ja stimmen!

Eines muss Mann dem Klapperer lassen: die Quellenauswahl ist nicht zu beanstanden.

[–] Jiral@lemmy.org 1 points 16 hours ago* (last edited 1 hour ago)

Gemma 4 31B (Q8_0). Lokales Modell ohne Internetzugang. Ich verwende kaum LLMs aus diversen Gründen aber mich interessieren sie durchaus technisch. Ich muss sagen, dass mich Gemma 4 derzeit am meisten überzeugt. Es schleimt zwar unerträglich wie alle Google Modelle aber im Vergleich zu anderen Modellen ist es oft relativ kompakt oder gar präzise in der Antwort. Andere Modelle bullshitten deutlich mehr. Das zeigt auch diese Antwort. (im Reasoning gab es einen Fehler da schrieb es was von zwei t in Sonntag aber das Ausgabeergebnis ist fehlerfrei.

[–] A_norny_mousse@piefed.zip 16 points 1 day ago (4 children)

😁

Und dann kommen immer wieder Leute die uns erklären warum LLMs Schwierigkeiten mit sowas haben, als wenn das dadurch besser würde.

[–] aaaaaaaaargh@feddit.org 8 points 1 day ago (1 children)

Ist es definitiv. Wenn man weiß, wieso etwas nicht funktioniert, dann kann man es versuchen zu reparieren und das wird auch geschehen. KI nervt und ich hasse es, aber ich glaube, wir müssen uns damit leider abfinden.

[–] SkavarSharraddas@gehirneimer.de 3 points 20 hours ago (2 children)

Kommt drauf an ob prinzipbedingtes Problem ist oder nicht, bei ersteren kann man nur versuchen die "KI" zu überreden nicht die Antworten zu geben die man nicht haben will ("don't talk about goblins") oder für Einzelfälle die richtige Antwort vorgeben (jede virale falsche Antwort wie "how many r in strawberry" die dann richtig beantwortet wird, aber keine generelle Lösung für andere Fragen der gleichen Klasse bietet).

[–] Anivia@feddit.org 1 points 1 hour ago* (last edited 1 hour ago)

oder für Einzelfälle die richtige Antwort vorgeben (jede virale falsche Antwort wie "how many r in strawberry" die dann richtig beantwortet wird, aber keine generelle Lösung für andere Fragen der gleichen Klasse bietet).

Ne, da hast du ein schlechtes Beispiel gewählt, denn das Problem taucht nur bei "gewöhnlichen" LLMs auf, nicht bei reasoning Modellen. Für das Beispiel muss man also nicht für den Einzelfall die Lösung vorgeben, reasoning Modelle haben mit der Frage keine Probleme

Auch OPs Beispiel wird nur von gewöhnlichen LLMs falsch beantwortet, reasoning Modelle beantworten die Frage richtig:

[–] A_norny_mousse@piefed.zip 2 points 16 hours ago

🔔🔔🔔

[–] fizzgig@feddit.org 2 points 1 day ago (2 children)

Jetzt will ich wissen, weshalb die damit Probleme haben! :D

[–] jgjl@discuss.tchncs.de 3 points 19 hours ago

LLMs arbeiten nicht mit Buchstaben, sondern mit Tokens. Theoretisch könnte man Token=Buchstabe definieren, das wäre aber sehr ineffizient, daher macht man das nicht. Praktisch sind Tokens eher Silben oder Wortteile, also zb „Donners““Tag“ wären dann zwei Tokens. Jeder Token wird durch eine Zahl repräsentiert und dann wird wild gerechnet. Aber wegen der Tokengeschichte kann man da rechnen wie man will, die Buchstaben kennt das LLM nicht und kann daher damit auch nicht wirklich arbeiten. Daher wird halt ein plausibler Text generiert der halt in diesem Fall nichts mit der korrekten Antwort zu tun hat.

[–] SkavarSharraddas@gehirneimer.de 3 points 20 hours ago

Was LLMs ausgeben ist nicht die Antwort auf die Frage "Welche Wochentage haben den Buchstaben T?" sondern "Wie könnte eine Antwort auf die Frage 'Welche Wochentage haben den Buchstaben T?' aussehen?"

Man kann dann noch Details rumerklären wie dass die mit Tokens arbeiten und keine Wörter oder Buchstaben kennen, aber das grundsätzliche Problem ist dass hinter der Ausgabe keine echte Intelligenz steckt, sondern Statistik¹ beruhend auf dem Trainingsmaterial die durch kompetent wirkende Sprachproduktion intelligent wirkt.

¹ Sehr komplexe Statistik, und mehr Ebenen von Komplexität drüber die versuchen die offensichtlichen Probleme zu kaschieren.

[–] Randelung@lemmy.world 3 points 1 day ago

Nein nein, du hast es nur falsch verwendet! Wenn du fünf weitere LLMs mit folgendem Satz als Workflow einstellst, sinkt die Chance eines Fehlers um 2%!

Wie Artikel von Effizienz sprechen, ist mir schleierhaft. Du brauchst ein ganzes Team der Bullshitmaschinerie in der Hoffnung, einer davon produziert Shakespeare.

[–] Tarogar@feddit.org 4 points 22 hours ago (1 children)

Das K in KI steht für kaputt.

[–] A_norny_mousse@piefed.zip 3 points 16 hours ago

Ich mag die englische Altenativdefinition: "Actually Indians".

[–] Kornclown@feddit.org 5 points 1 day ago (2 children)
[–] stardustpathsofglory@lemmy.world 3 points 17 hours ago

Gute Antwort! Welches Model hast du da verwendet?

[–] Jiral@lemmy.org 3 points 23 hours ago* (last edited 23 hours ago) (1 children)

Welches Modell ist das?

Ich habe es gerade mit Copilot probiert und da waren auch alle sieben, schön in Reihenfolge. Inkl. korrekter Internetquelle zu Wochentage auf Deutsch. Mich überrascht, dass da Claude Sonnet 4.6 soviel schlechter ist.

[–] Kornclown@feddit.org 4 points 23 hours ago (1 children)

Opus 4.8, Sonnet 4.6 kriegt es nicht hin:

[–] Jiral@lemmy.org 1 points 23 hours ago* (last edited 23 hours ago)

Ich muss das mal lokal ausprobieren: Gemma4 31B, Qwen 3.6 27B und GPT-OSS 120B

Es würde mich interessieren wie die im Vergleich zu Claude abschneiden.

[–] HaraldvonBlauzahn@feddit.org 3 points 1 day ago

Das ist gemein, die KI so zu überfordern!

[–] jmizv@feddit.org 1 points 1 day ago

So gut, dass es noch die deutsche Übersetzung in Klammern dahinter geschrieben hat E>