ファインチューニングとは?
読み: ファインチューニング英語: Fine-tuning
事前学習済みLLMに対し、特定タスクや独自データで追加学習を行ってモデルを専門化する手法。
詳しい解説
ファインチューニングは、事前学習済みの LLM (汎用モデル) に対して、特定のタスクや独自データセットで追加学習を行い、モデルの振る舞いを専門化させる手法です。
汎用 LLM では精度が不足するタスク (専門用語の理解、社内独自フォーマットの生成、特定の口調・スタイル) や、コスト・レイテンシを下げるための小型モデル化、推論速度の高速化などを目的として行います。
代表的な手法に、全パラメータを更新する Full Fine-tuning、低ランク行列だけを更新する LoRA、量子化と組み合わせる QLoRA、強化学習で人間の嗜好を学習する RLHF / DPO などがあります。 RAG (検索組み込み) で対応できる場合はファインチューニングよりも先に RAG を検討するのが一般的です。
この分野を学べる生成AIスクール
ファインチューニングを含む生成AIのスキルを体系的に身につけたい方は、AI HACK のスクールランキングをご活用ください。