タグ: Transformer

InstructGPTの概要まとめ〜GPT3、RLHF、RewardModel〜

投稿日: 2023-07-232023-09-14 投稿者: lib-arts

近年大きな注目を集めるChatGPTの学習にあたっては、強化学習に基づくRLHF(Reinforcement Learning from Human Feedback)がfinetuningに用いられます。当記事では同様…

全文を読む

『直感的に理解するTransformer』サポートページ【印刷版】

投稿日: 2023-05-112023-11-18 投稿者: lib-arts

技術書典$14$で頒布を行った『直感的に理解するTransformer』の印刷版のサポートページです。主に誤植が見つかった場合の正誤表の作成やカラー画像の確認が行えるように作成を行いました。誤植につきましては見つかり次第…

全文を読む