Die neue KI-Verstärkungsfine-Tuning von OpenAI könnte verändern, wie Wissenschaftler ihre Modelle nutzen.

Der zweite Tag von OpenAI’s 12 Days of OpenAI verschob sich zu weniger spektakulären, eher unternehmerischen Interessen im Vergleich zum allgemeinen Rollout des OpenAI o1-Modells für ChatGPT am ersten Tag.

Stattdessen kündigte OpenAI Pläne an, Reinforcement Fine-Tuning (RFT) zu veröffentlichen, eine Möglichkeit, seine KI-Modelle für Entwickler anzupassen, die die Algorithmen von OpenAI für spezifische Aufgaben, insbesondere komplexere, anpassen möchten. Diese Veröffentlichung markiert einen klaren Schwenk hin zu unternehmerischen Anwendungen im Vergleich zu den auf den Verbraucher ausgerichteten Updates des ersten Tages. Man kann sich RFT als eine Methode vorstellen, um die Funktionsweise von KI-Modellen durch ihre Argumentation für Antworten zu verbessern. Durch die Verwendung eines Datensatzes und einer Bewertungsrubrik von einem Entwickler kann die Plattform von OpenAI ihre spezialisierte KI trainieren, ohne auf teure Verstärkung aus späteren Erfahrungen angewiesen zu sein.

RFT könnte ein Segen für KI-Tools sein, die in Recht und Wissenschaft eingesetzt werden. OpenAI hob in seinem Livestream den CoCounsel-KI-Assistenten hervor, der mit RFT von Thompson Reuters entwickelt wurde, und wie RFT Forschern am Berkeley Lab hilft, seltene genetische Krankheiten zu untersuchen. Die Geschäftspartnerschaften werden jedoch kurzfristig nicht viel für durchschnittliche Benutzer von ChatGPT oder anderen OpenAI-Produkten bewirken.

Heute kündigen wir die Verfeinerung der Verstärkung an, mit der es wirklich einfach ist, Expertenmodelle in bestimmten Bereichen mit sehr wenig Schulungsdaten zu erstellen. Livestream läuft jetzt: https://t.co/ABHFV8NiKc Alpha-Programm beginnt jetzt, öffentlicher Start im 1. Quartal 6. Dezember 2024.

Unternehmen oder Verbraucher

Wenn Sie mehr auf der Verbraucherseite sind, geben Sie noch nicht auf. Obwohl der unternehmerische Schwerpunkt im Gegensatz zum ersten Tag steht, ist es leicht vorstellbar, dass OpenAI während der 12 Tage so viele verschiedene Nachrichten wie möglich haben möchte. Es wird mit Sicherheit noch viele weitere Verbraucher-News geben. Vielleicht abwechselnde Tage oder ein anderes Muster.

LESEN Rocket Pharmaceuticals legt einen Aktienpreis von 12,50 $ für das Angebot fest. Von Investing.com.

Dennoch war zumindest der Schlusswitz von OpenAI etwas lustiger als gestern. Die KI beschrieb, wie selbstfahrende Fahrzeuge in San Francisco beliebt sind und Santa bestrebt ist, einen selbstfahrenden Schlitten im Rahmen des Trends zu entwickeln. Das Problem ist, dass er ständig Bäume trifft. Was ist das Problem? Er hat seine Modelle nicht maßgeschneidert. Vielleicht wird das Bild, das ChatGPT für den TechRadar-Redakteur Lance Ulanoff erstellt hat, den Humor besser verkaufen.