OpenAI 连续 12 天 AI 发布会:第二天完整视频(中英文双语字幕)

Subscribers:
6,590
Published on ● Video Link: https://www.youtube.com/watch?v=cJ6Wpyre5FQ



Duration: 0:00
1,323 views
11


强化微调,通过少量数据,让模型在专业领域到达专家水平。 跟之前的微调不一样,它不是通过把数据记住答案,而是在微调的过程中训练自己在某个领域的推理能力找到正确答案,有点像给 AI 一本棋谱,让它自己训练自己下棋。

这种微调有两个不同数据集合,一个是微调数据集,一个是测试数据集合,模型先基于微调数据集合去训练,然后用测试数据集合验证,反复自我推理训练验证,最终达到很高的水平。




Other Videos By 宝玉的技术分享


2024-12-20OpenAI 连续 12 天 AI 发布会:第十二天 —— 最新一代推理模型 o3 和 o3-mini 发布介绍
2024-12-19OpenAI 连续 12 天 AI 发布会:第十一天 —— ChatGPT 桌面应用如何与各类应用无缝协作,让工作更高效
2024-12-18OpenAI 连续 12 天 AI 发布会:第十天 —— 通过 1-800-CHAT-GPT 电话和 ChatGPT 聊天
2024-12-17OpenAI 连续 12 天 AI 发布会:第九天 —— Dev Day
2024-12-16OpenAI 连续 12 天 AI 发布会:第八天 —— Search(中英文双语字幕)
2024-12-13OpenAI 连续 12 天 AI 发布会:第七天 —— Projects
2024-12-12OpenAI 连续 12 天 AI 发布会:第六天完整视频(中英文双语字幕)
2024-12-11OpenAI 连续 12 天 AI 发布会:第五天完整视频(中英文双语字幕)
2024-12-10OpenAI 连续 12 天 AI 发布会:第四天完整视频(中英文双语字幕)
2024-12-09OpenAI 连续 12 天 AI 发布会:第三天完整视频(中英文双语字幕)
2024-12-06OpenAI 连续 12 天 AI 发布会:第二天完整视频(中英文双语字幕)
2024-12-05OpenAI 连续 12 天发布会:第一天完整视频(中英文双语字幕)
2024-10-25如何写好提示词?(6/完)
2024-10-25如何写好提示词5
2024-10-24如何写好提示词4
2024-10-23如何写好提示词3
2024-10-23如何写好提示词2
2024-10-16如何写好提示词?(上)
2024-07-03对标 GPT-4o 的开源实时语音多模态模型 Moshi
2024-07-03OpenAI 联合创始人 Andrej Karpathy 在2024年加州大学伯克利分校人工智能黑客马拉松颁奖典礼上的主题演讲
2024-06-05一起学多 AI 智能体系统(双语字幕)- 7. 智能体系统中让工具表现出色的关键因素