OpenAI 连续 12 天 AI 发布会:第二天完整视频(中英文双语字幕)
Channel:
Subscribers:
6,590
Published on ● Video Link: https://www.youtube.com/watch?v=cJ6Wpyre5FQ
强化微调,通过少量数据,让模型在专业领域到达专家水平。 跟之前的微调不一样,它不是通过把数据记住答案,而是在微调的过程中训练自己在某个领域的推理能力找到正确答案,有点像给 AI 一本棋谱,让它自己训练自己下棋。
这种微调有两个不同数据集合,一个是微调数据集,一个是测试数据集合,模型先基于微调数据集合去训练,然后用测试数据集合验证,反复自我推理训练验证,最终达到很高的水平。
Other Videos By 宝玉的技术分享
2024-12-20 | OpenAI 连续 12 天 AI 发布会:第十二天 —— 最新一代推理模型 o3 和 o3-mini 发布介绍 |
2024-12-19 | OpenAI 连续 12 天 AI 发布会:第十一天 —— ChatGPT 桌面应用如何与各类应用无缝协作,让工作更高效 |
2024-12-18 | OpenAI 连续 12 天 AI 发布会:第十天 —— 通过 1-800-CHAT-GPT 电话和 ChatGPT 聊天 |
2024-12-17 | OpenAI 连续 12 天 AI 发布会:第九天 —— Dev Day |
2024-12-16 | OpenAI 连续 12 天 AI 发布会:第八天 —— Search(中英文双语字幕) |
2024-12-13 | OpenAI 连续 12 天 AI 发布会:第七天 —— Projects |
2024-12-12 | OpenAI 连续 12 天 AI 发布会:第六天完整视频(中英文双语字幕) |
2024-12-11 | OpenAI 连续 12 天 AI 发布会:第五天完整视频(中英文双语字幕) |
2024-12-10 | OpenAI 连续 12 天 AI 发布会:第四天完整视频(中英文双语字幕) |
2024-12-09 | OpenAI 连续 12 天 AI 发布会:第三天完整视频(中英文双语字幕) |
2024-12-06 | OpenAI 连续 12 天 AI 发布会:第二天完整视频(中英文双语字幕) |
2024-12-05 | OpenAI 连续 12 天发布会:第一天完整视频(中英文双语字幕) |
2024-10-25 | 如何写好提示词?(6/完) |
2024-10-25 | 如何写好提示词5 |
2024-10-24 | 如何写好提示词4 |
2024-10-23 | 如何写好提示词3 |
2024-10-23 | 如何写好提示词2 |
2024-10-16 | 如何写好提示词?(上) |
2024-07-03 | 对标 GPT-4o 的开源实时语音多模态模型 Moshi |
2024-07-03 | OpenAI 联合创始人 Andrej Karpathy 在2024年加州大学伯克利分校人工智能黑客马拉松颁奖典礼上的主题演讲 |
2024-06-05 | 一起学多 AI 智能体系统(双语字幕)- 7. 智能体系统中让工具表现出色的关键因素 |