Corinna Ehlers's Avatar

Corinna Ehlers

@corinnaehlers

Grenzgängerin Theologie/Bibliothek @ixtheo.bsky.social. Außerdem: Christentumsgeschichte, Bibliotheksgeschichte, Editionen, Alte Drucke. Fediverse: corinnaehlers@openbiblio.social. Privater Account.

1,299
Followers
1,019
Following
1,050
Posts
02.10.2023
Joined
Posts Following

Latest posts by Corinna Ehlers @corinnaehlers

Aber ja klar, lass uns in ein paar Jahren noch einmal reden. Ich glaube zwar nicht, dass das Grundproblem veränderbar ist, aber spannend finde ich, wie hoch in ein paar Jahren die Quote von "KI sagt sinnvollerweise: kann ich nicht zuordnen" sein wird.

06.03.2026 20:56 👍 1 🔁 0 💬 1 📌 0

Für den Fall, den du nicht kennst, meine ich auch, dass das alles geht. Wenn auch unklar ist wie gut. Wir haben bisher J/N, aber klar ginge das komplexer.

Mein Punkt ist: Bei den Personen geht das im Unterschied dazu nicht. Aus prinzipiellen, wissenschaftstheoretisch erklärbaren Gründen.

06.03.2026 20:47 👍 1 🔁 0 💬 1 📌 0

Aber das Problem ist doch genau das: Der Mensch merkt mit einer gewissen Erfahrung, dass alle verfügbaren Optionen nicht passen können. Und schreibt not identified in die Fußnote oder recherchiert. Das geht technisch nur für so eindeutige Fälle wie: Person war da schon tot.

06.03.2026 20:35 👍 0 🔁 0 💬 1 📌 0

Eigentlich nicht. Es ist viel, viel, viel einfacher als Personenzuordnung. Berufe der Autoren sind zB ermittelbar, bestimmte Stichworte verdächtig ohne dass ich davon (wie bei klassischer Selektion) eine kpl Liste machen muss, u.ä. Das "lernt" die KI tatsächlich gut.

06.03.2026 20:32 👍 1 🔁 0 💬 0 📌 0

Wenn es denn Stumpfsinn ist, ja. Bei so Selektionsprozessen geht das oft. Aber ich wiederhole mich: bei hist. Personen gibt es kein Level Stumpfsinn. Da braucht es jahrelange Erfahrung, die im Zweifel auch nur zu: hää, das ist alles unlogisch. Ich brauche ein Lexikon aus einem fremden Fach, führt.

06.03.2026 20:28 👍 1 🔁 0 💬 1 📌 0

Auf null Fehler komme ich erst dann, wenn ich jeden Fall trainiere. Das aber ist nicht Sinn der Sache. Ich kann alle Fehler, Kontexte... trainieren oder Daten dafür füttern, die ich vorhersehe. Die müssen also im Großen und Ganzen vorhersagbar sein. Das ist hier der Fall. Bei Personen nicht.

06.03.2026 20:23 👍 2 🔁 0 💬 1 📌 0

Wir kriegen die KI nach meinem Eindruck recht leicht aufs Level eines unerfahrenen Hiwis. Macht sogar strukturell ähnliche Fehler. Frage: Wie viel präziser wollen wir? Wenn wir ihr den einen systematischen Fehler abgewöhnen, baut sie dann deshalb andere ein?

06.03.2026 20:14 👍 1 🔁 0 💬 2 📌 0

Aktuelles Bsp: KI- Selektion historischer Bücher zu Fach x aus riesigem Datenbestand. Reines Whitelisting. Ziel: unter 2% false positives. False negatives können in Kauf genommen werden, weil Resultat in den Fällen status quo. Das geht ganz leidlich. Weil dieser Spielraum drin ist.

06.03.2026 20:10 👍 1 🔁 0 💬 2 📌 0

Und was das Trainieren angeht, so sagen mir die Kollegen, die bei uns KI-Anwendungen pragmatisch für die Bibliothek entwickeln, auch: Geht zwar. Aber man muss sehr aufpassen, dann nicht wieder so überzutrainieren, dass es dadurch woanders (unvorhersehbar) falsch wird. Schon bei viel simpleren Fragen

06.03.2026 20:06 👍 1 🔁 0 💬 2 📌 0

Wieso nimmt man nicht etwas, wo die Menge Optionen endlich ist? Bei Ortsnamen für eine ganz klar abgegrenzte Region und nur mit Quellen ab 1900 (oder auf Latein) kann ich mir vorstellen, dass es mit tolerabler Fehlerquote geht. Denn die Menge Orte ist eben nicht unendlich, die kann ich reinfüttern.

06.03.2026 19:59 👍 1 🔁 0 💬 2 📌 0

Du klingst genau so wie die Leute, von denen ich immer Vorträge höre. Gerade mit Personen habe ich das schon so oft gehört und Beispiele gesehen. Waren immer total stolz. Und jedes einzelne Mal war das Ergebnis nicht ein paar Fehler, sondern Level "soll ich mich totlachen oder schreiend davonlaufen"

06.03.2026 19:45 👍 1 🔁 0 💬 2 📌 0

Denn letzteres kann ich nicht trainieren. Aktuelles High End Level laut Experte von neulich ist, dass die KI in dem Fall antwortet "weiß ich nicht" bzw. flaggt "kann ich nicht zuordnen". Aber auch letzteres - wenn nur 1 bekannt ist und ungefähr passen könnte, wird das zugeordnet werden, auch falsch.

06.03.2026 19:29 👍 1 🔁 0 💬 0 📌 0

Das ist mir klar. Ich kann das zwar nicht selbst programmieren, aber ich arbeite ständig mit Leuten, die das tun.
Ich bin hier konkret skeptisch bzgl. Dingen, wo die Zahl möglicher Optionen prinzipiell unendlich und nicht vorab zu ermitteln ist und zudem noch nie erfasste Gegenstände enthält.

06.03.2026 19:26 👍 2 🔁 0 💬 2 📌 0

Ich bin gar nicht prinzipiell gegen KI-Nutzung. Aber ich würde das auf Sachen beschränken, bei denen Unschärfe tolerabel ist (ich will wissen, in welchen der Texte meines Korpus gehäuft Inseln vorkommen. Ich brauche nicht jeden Treffer) oder wo die Menge Optionen endlich und definierbar ist.

06.03.2026 19:16 👍 2 🔁 0 💬 1 📌 0

Das ist mE der Denkfehler. Gesichter weichen immer ein wenig ab. Wenn ich 6 versch. Hans/Johann Meier habe, weiß die KI hingegen nicht, welcher das ist. Und sie kommt nicht auf die Idee, dass alle in Wikidata oder GND vorhandenen nicht passen und sie einen 7. (bis unendlich vielten) annehmen muss.

06.03.2026 19:08 👍 2 🔁 0 💬 2 📌 0

Historische Personen sauber zuordnen klappt nicht mal, wenn Liste vorher bekannt und Schreibung einheitl. ist. Erst recht nicht mit dem realen Chaos. Man muss jede Zuordnung intellektuell prüfen, was sowohl aufwändiger als auch anfälliger (falsche Fährte) ist als dass es gleich ein Mensch macht.

06.03.2026 19:03 👍 3 🔁 0 💬 0 📌 0

Und Personenverzeichnisse aus einem Konvolut historischer Texte extrahieren ist das Paradebeispiel für etwas, das ich nicht machen würde. Wir haben das mal probiert zu meiner Editionszeit. Damals noch ohne KI mit nachprüfbaren Algorithmen. Es ist GRAUENHAFT, was dabei an Mist rauskommt.

06.03.2026 18:58 👍 2 🔁 0 💬 2 📌 0

Ja klar, KI an eigenen Quellen trainieren geht. Aber man darf den Aufwand nicht unterschätzen. Ich habe neulich den Fachvortrag eines Experten gehört, der genau das macht. Für einen eng umrissenen Bereich. Seit Jahren. Hauptberuflich. Jetzt langsam erste Durchbrüche.

06.03.2026 18:58 👍 1 🔁 0 💬 1 📌 0

Die Ökosysteme sind eine schöne Idee. KI würde ich da aber höchstens für ganz eingeschränkte nachprüfbare oder rein technische Vorgänge nehmen, sonst hat man ja - gerade da! - eine Verschlimmerung statt Verbesserung.

06.03.2026 18:39 👍 3 🔁 0 💬 1 📌 0

In diesem Fall hättest du dann noch die Chance gehabt, die Autorin zuerst anzuschreiben und danach in Wikipedia zu korrigieren, sobald sie korrigiert hat. Wäre sie zB 1 Jahr davor verstorben, ginge auch das nicht... Und wäre eine solche Auslegung für egal wen hilfreich?

06.03.2026 18:35 👍 1 🔁 0 💬 1 📌 0

Das ist doch sehr cool. 👍
Nur siehst du, um eben so was ging es mir ja ursprünglich: Wenn man die obenstehenden Argumente zu Ende denkt, hättest du den Fakt in Wikipedia falsch rapportieren müssen, weil er in der ÖB als autoritativer enzyklopädischer Quelle so steht. Auch wenn du Gegenbeweise hast.

06.03.2026 18:34 👍 0 🔁 0 💬 1 📌 0

Naja, es hat leider auch nicht nur mit sensibel zu tun. Du kannst nichts dafür, aber als Mann, "Biodeutscher" und mit eher technischem Beruf (usw.) kriegst du bestimmte Tonlagen und Polemiken wahrscheinlich auch deutlich seltener ab als Personen /Themen, für die all das nicht gilt.

06.03.2026 18:25 👍 1 🔁 0 💬 1 📌 0

Dass viele Artikel in Fachenzyklopädien ganz genau so entstehen und auch nicht besser sind (Ursache: Man wird gefragt und traut sich nicht zu sagen "Ich habe keine Ahnung und keine Zeit die Quellen zu lesen") steht auf einem anderen Blatt.

06.03.2026 18:17 👍 1 🔁 0 💬 1 📌 0

Und auf letzteres läuft es in meinem groben Gebiet wegen genannter extremer Veraltung der Literatur leider raus, wenn ich etwas zu Dingen schreibe, von denen ich nicht wirklich etwas verstehe.

06.03.2026 18:14 👍 2 🔁 0 💬 2 📌 0

Das ist genau ein weiterer Grund, warum ich (quasi) nichts schreibe. Ich möchte nicht meine persönlichen Forschungsthesen reinschreiben, aber auch keinen oberflächlichen veralteten Blödsinn perpetuieren und autoritativ machen.

06.03.2026 18:14 👍 3 🔁 0 💬 1 📌 0

Und die ungleiche Verteilung der Probleme je nach Thema ist ja auch kein Zufall. Das von dir angesprochene Problem ist im Grunde die Kehrseite des von mir genannten, nur mit einer Sorte Thema/These, die reinkommt. Und dann gibt es Themen mit so viel guten Leuten, dass die Debatte funktioniert.

06.03.2026 17:58 👍 2 🔁 0 💬 1 📌 0

Der Teil, dass bestimmte Menschen das eher dürfen, bestimmte Themen eher reinkommen als andere, etc. der wäre zu lösen. Aber nur mit einer kritischen Masse der Menschen, die aktuell vielfach rausgeekelt und abgeschreckt werden (es ist ja oft keine sachliche Kritik).

06.03.2026 17:55 👍 1 🔁 0 💬 1 📌 0

Darum sage ich ja, dieser Teil ist ein strukturelles Problem. bsky.app/profile/cori...

06.03.2026 17:51 👍 3 🔁 0 💬 2 📌 0

Ich habe im Moment gar keinen. Das ist es ja 😅

06.03.2026 17:34 👍 1 🔁 0 💬 1 📌 0

hätte Wikipedia eine Rezeptionsverspätung wie Schulbücher. 30 Jahre +x. Bei Konversationslexika noch mehr. Ganz abgesehen davon, dass in dem angesprochenen Bereich auch vorhandene Artikel in Fachenzyklopädien nicht notwendig rezipiert werden.

06.03.2026 17:31 👍 1 🔁 0 💬 1 📌 0