メインコンテンツへスキップ
AI HACK国内最大級の生成AIスクール・講座検索サイト
スクール一覧法人向けランキング記事スクールを探す
AI HACK

スクール

スクール一覧生成AI総合AI×動画生成無料セミナーAI×デザインAI×プログラミングAI×マーケティングAI×業務活用AI×フリーランス

AI研修

研修一覧AI研修IT研修DX研修AI×動画生成研修AI×画像生成研修DX支援補助金

コンテンツ

ランキング記事特集口コミ生成AI用語集

サイト情報

運営情報お問い合わせプライバシーポリシー利用規約口コミガイドラインサイトマップ

© 2026 AI HACK - AIスクール・AI研修の検索、比較、口コミサイト

  1. TOP
  2. /用語集
  3. /RLHF (人間のフィードバックによる強化学習)
生成AI基礎

RLHF (人間のフィードバックによる強化学習)とは?

読み: アールエルエイチエフ英語: Reinforcement Learning from Human Feedback

人間がモデルの出力に与えた選好データを使い、強化学習で LLM の振る舞いを人間の意図に沿わせる手法。

詳しい解説

RLHF (Reinforcement Learning from Human Feedback) は、LLM の事前学習後に、人間が「より好ましい」と判断した出力を学習させて、モデルを人間の意図・価値観に沿った振る舞いに近づける手法です。

具体的には、複数のモデル出力に対して人間が優劣をラベル付けし、その選好データから報酬モデルを学習。続いて強化学習 (PPO など) で LLM の方策をこの報酬モデルに従って更新します。

ChatGPT が「丁寧で安全な対話」を実現できているのは RLHF (および後継の DPO や Constitutional AI) によるアライメントの貢献が大きいとされます。一方で、人手のラベリングコストやバイアス混入のリスクも課題として研究が続いています。

関連用語

ファインチューニング事前学習済みLLMに対し、特定タスクや独自データで追加学習を行ってモデルを専門化する手法。アライメントAIシステムの振る舞いを人間の意図・価値観・倫理基準に整合させるための研究および設計活動。

この分野を学べる生成AIスクール

RLHF (人間のフィードバックによる強化学習)を含む生成AIのスキルを体系的に身につけたい方は、AI HACK のスクールランキングをご活用ください。

総合ランキングを見る →おすすめスクール19選を見る
← 用語集の一覧へ戻る