【開催記録】ALIGN Webinar #10「LLMのアライメント技術」(ゲスト:今井翔太さん)
第10回のALIGNウェビナーでは、AI研究者の今井翔太さんにご講演いただきました。
日時:2024年8月19日(月)5:00 pm-6:00 pm (日本時間)
参加者:オンラインで90名ほど
今井さんは、東京大学松尾研究室にてAI研究に従事され、現在は新たな挑戦に向けて準備中。強化学習、マルチエージェント、生成AI、LLM、ゲームAIなどを専門に研究を展開され、2024年1月には、単著『生成AIで世界はこう変わる』(SB新書)を刊行されました。
本ウェビナーでは、大規模言語モデル(LLM)のアライメント技術をテーマとしし、その代表的な手法であるRLHFとDPO (direct preference optimization)の関係性と比較、そして発展的な話題としてのAIによるフィードバック(RLAIF)の有効性などについて解説いただきました。
本講演のスライド資料を後日公開予定です。
※資料、本記事、動画の許可のない転載を禁じます。