Finetuning Tutorial - So trainierst Du Dein eigenes GPT-Modell bei OpenAI

preview_player
Показать описание

📖 Prompt für das Erstellen der .jsonl-Datei aus reinem Text bei Claude:
Bitte konvertiere diesen Plaintext in ein JSONL-Format (JSON Lines). Jeder Eintrag sollte ein JSON-Objekt in einer einzigen Zeile sein. Das JSON-Objekt sollte ein 'messages' Array enthalten mit drei Objekten: eines für 'system', eines für 'user' und eines für 'assistant'. Jedes dieser Objekte sollte 'role' und 'content' Felder haben. Der 'content' des assistant-Objekts sollte die Vor- und Nachteile als Markdown-formatierter Text enthalten, mit '# [Thema]' als Überschrift der ersten Ebene und '## Vorteile' und '## Nachteile' als Überschriften der zweiten Ebene. Die Listeneinträge sollten mit Ziffern und Punkten formatiert sein. Bitte stelle sicher, dass jede JSON-Zeile gültig ist und keine Zeilenumbrüche innerhalb eines JSON-Objekts vorkommen.

In diesem Video zeigen wir euch Schritt für Schritt, wie man die OpenAI Modelle auf der Website ganz einfach "finetunen" kann und sich damit eigene Versionen des ChatGPT-Modells erstellen kann, die ganz genau so antworten, wie man es gerne hätte.

Wir lernen dabei, was Finetuning ist, für wen und welche Anwendungen es sich eignet und spielen gemeinsam in der Praxis das komplette Training eines eigenen Modells durch, von der Erstellung der Trainingsdaten, bis zum Vergleich des fertig trainierten Modells. Viel Spaß beim Video!

Werde Kanalmitglied und unterstütze damit unsere Arbeit:

00:00 Umfassendes Tutorial für das Finetuning von Modellen bei OpenAI
00:52 Was bedeutet Finetuning von KI-Modellen eigentlich?
02:21 Voraussetzungen: Was brauchen wir für das Finetuning?
05:30 Erstellen von Beispieldaten
07:25 So erstellt man eine .jsonl Datei für das Modelltraining aus reinem Text
12:05 Einen neuen Finetuning-Job bei OpenAI anlegen
15:34 Unser neues Modell ausprobieren
18:49 Markdown-Format korrekt darstellen
19:58 Überblick über die Kosten für Anfragen und Finetuning von GPT-4o
21:29 Für wen ist das Finetuning sinnvoll? Was sind gute Anwendungen?

Videovorschläge, Feedback und Kritik kannst Du uns jederzeit in den Kommentaren mitteilen!
Рекомендации по теме
Комментарии
Автор

Ihr seid einfach nur der Knaller 💥 Präzise und sauber erklärt. Volle Punktlandung und es hat bei meinem speziellen Bot sogar auf Anhieb super geklappt und dann noch innerhalb genau der Erklärzeit von 23 Minuten. Vielen Dank für Eure tolle Arbeit und Mühen und bitte macht unbedingt weiter so! Abo, Like & Comment!😍

Wahrheit
Автор

Ein super video, sehr gut und ruhig erklärt. Die Entwickler aus US sind mir echt zu hektisch unterwegs. WEITER SO!
💥

Leonardo_A
Автор

Respekt! Ich muss das Video wohl öfters schauen. Aber der der Informationsgehalt ist Mega! Vielen Dank dafür!

ClemensKegel
Автор

Super erklärt mal wieder! 👌
Ihr würdet beide erstklassige Dozenten abgeben! 🙂👍

MartGC
Автор

Kann ich das getuned Modell nicht exportieren und zB bei Huggingsface importieren und dann dort allgemein verfügbar machen?

axelwehmeyer
Автор

Toll erklärt. Vielen Dank. Erstaunlich, dass das Ergebnis bei den wenigen Trainingsdaten trotzdem so gut war. Werden wir ausprobieren ! Schade, dass JSONL verwendet wird und kein normales JSON mit einem Array.

uwegenosdude
Автор

Danke für das Video. Frage: wo werden die Daten die man für das Finetuning verwendet gespeichert? Ich nehme an bei OpenAI auf dem Server. Konnte nirgends den Hinweis finden, dass diese Daten von OpenAI nicht für ihre eigene Trainings verwendet würden. Habt ihr da Infos dazu?

ttchma
Автор

Vielen Dank für den interessanten Clip. Was ist dann der Unterschied zu einem eigenen GPT?

reneelechner
Автор

super erkläart auch für Anfänger. Ich habe immer gedacht was ist dieses finetuning überhaupt. Angespitzte Buchstaben vielleicht ?

franzimeier
Автор

Wird durch das Finetuning das Modell dadurch besser oder gebe ich dabei nur die Antworten damit vor? Was ich damit meine, ich würde damit gerne eine Modell trainieren und dies soll in Zukunft mit dem Wissen auch mein Wissen besser verstehen. Ich hoffe ich hab mich da richtig ausgedrückt.

hicad
Автор

Warum wurde für das konvertieren der Text Datei nicht auch Chat GPT verwendet, so anspruchsvoll ist die Aufgabe ja eigentlich nicht - oder?

sachsaseil
Автор

Das funktioniert vielleicht bei Verwendung des fertigen Models als Chatbot ganz gut, aber ich hatte mal versucht das Model mit unseren Produktdaten zu füttern und es dann als Suchfunktion zu nutzen, aber da kommt nur Unsinn bei raus. Geht schon los damit, wie soll man Produktdaten in der JSON-L formulieren. Ich kann ja nicht jede Mögliche Suchanfrage für ein paar tausend Produkte vorformulieren, wo bleibt denn da die KI? Und die Ergebnisse... Ich hab dann mal auf das Model Testabfragen durchgeführt und erhielt Artikeldaten zurück, die nichts mit den zuvor gelernten zu tun hatten. Auf die Rückfrage, 'woher hast du denn diese Daten' erhielt ich die Antwort, dass die aus einem Onlienshop unter der URL sowieso kommen...?

cooper
Автор

Kann man so framing Tendenzen austreiben und negativ Beispiele geben, die also nicht in der Antwort auftauchen sollen?

sachsaseil
Автор

Ich will aber genau ein eigenes Modell mit eigenen Daten (ich habe eine große Menge von PDF mit Spezialwissen, das ChatGPT NICHT hat) trainieren. Systemprompts zu tunen reicht mir nicht. Gibt es für diese Anforderung eine Möglichkeit bei OpenAI oder woanders?

axelwehmeyer