NEW OpenAI Reinforcement Fine-Tuning! (12 Days of OpenAI)

Показать описание

Today OpenAI showcased their new Reinforcement Fine-Tuning feature!

--------------------
📞 90 Minute Consulting

🛒AI Templates, Prompts and Courses for ChatGPT and Midjourney:

📰Visit our website:

🔗Follow me on Linkedin:

🐥Follow me on twitter:
--------------------

⌚Chapters:
0:00 - OpenAI Reinforcement Fine Tuning
2:16 - Free Ai Community
3:07 - Recap of Reinforcement Learning Demo
11:00 - Understand Reinforcement Fine Tuning
16:35 - Our Free Ai Community

#chatgpt #openai

Рекомендации по теме

Комментарии

Thanks for sharing your knowledge on this Drake. Excellent information.

MJFUYT

your voice & easy explanation is better ease than actual openai videos!!

paragbharadia

I think the key here is the reward model learnt from graders ? since these are autonomous agents - it is likely a powerful model like O1 is used as a grader who has the access to groundtruth, so it can reason and guide the O1-mini (or smaller one that we are ReFT ing) to generate a positive or a negative reward or potentially fractional reward. I wonder how this kind of a solution is different from other agentic solutions that self-critize and "think".

deepak_babu

You are doing great 🥰🥰 watching you from the beginning 👏👏🥰🥰🙏🙏

MrBoxsoumendu

Exciting times! This is going to be huge.

ProductiveDude

NEW OpenAI Reinforcement Fine-Tuning! (12 Days of OpenAI)

NEW OpenAI Reinforcement Fine-Tuning! (12 Days of OpenAI)

Reinforcement Fine-Tuning—12 Days of OpenAI: Day 2

OpenAI Just Released a New Update: Reinforcement Fine-Tuning Research Program

What is Reinforcement Fine Tuning anyway? | Day 2 of 12 days of OpenAI

Reinforcement Fine Tuning OpenAI’s Game Changing Update! 🎄 12 Days of OpenAI Day 2

@OpenAI Day 2/12 | Reinforcement Fine-Tuning is a Gamechanger!

Reinforcement Fine Tuning (RFT) in OpenAI o1 Model | What is RFT? 12 Days of OpenAI

OpenAI 12 Days: Reinforcement Fine-Tuning Research Program

Reinforcement Fine-Tuning (RFT) Explained Simply - Day 2 of 12 Days of OpenAI

OpenAI Reinforcement Fine-Tuning Research Program: Day 2 : 12 Days of OpenAI

12 Days of OpenAI | Day2 Reinforcement fine tuning.

Day 2 of OpenAI's 12 Days: Reinforcement Fine-Tuning Explained:

Reinforcement Fine-Tuning｜OpenAI Day2's Summary in 4 minutes！

OpenAI Unveils Reinforcement Fine-Tuning for o1 Model! #chatgpt #openai #o1 #news

Fine-tuning ChatGPT with OpenAI Tutorial - [Customize a model for your application in 12 Minutes]

RAG vs. Fine Tuning

Santa Mode & Video in Advanced Voice—12 Days of OpenAI: Day 6

OpenAI's Sora and Reinforcement Fine-Tuning: A Game-Changer for Domain-Specific AI

Day 2 of 12 days of OpenAi Reinforcement learning to fine tune chatgpt models #ai #chatgpt #tech #ml

OpenAI Launches Reinforcement Fine-Tuning & ChatGPT Pro Demo - Your Questions Answered!

OpenAI o1 and o1 pro mode in ChatGPT — 12 Days of OpenAI: Day 1

02 Reinforcement fine turning - OpenAI 02/12 day

Open AI Shipmas Day 2 REACTION | Reinforcement Fine Tuning

o1 Reinforcement Fine Tuning: Who Is This Really For?