【開催記録】ALIGN Webinar #10「LLMのアライメント技術」(ゲスト:今井翔太さん)

第10回のALIGNウェビナーでは、AI研究者の今井翔太さんにご講演いただきました。

  • 日時:2024年8月19日(月)5:00 pm-6:00 pm (日本時間)

  • 参加者:オンラインで90名ほど

今井さんは、東京大学松尾研究室にてAI研究に従事され、現在は新たな挑戦に向けて準備中。強化学習、マルチエージェント、生成AI、LLM、ゲームAIなどを専門に研究を展開され、2024年1月には、単著『生成AIで世界はこう変わる』(SB新書)を刊行されました。 ​

本ウェビナーでは、大規模言語モデル(LLM)のアライメント技術をテーマとしし、その代表的な手法であるRLHFとDPO (direct preference optimization)の関係性と比較、そして発展的な話題としてのAIによるフィードバック(RLAIF)の有効性などについて解説いただきました。

本講演のスライド資料を後日公開予定です。

※資料、本記事、動画の許可のない転載を禁じます。

Previous
Previous

【開催記録】ALIGN Webinar #11 David A. Dalrymple (davidad) : the Safeguarded AI program at ARIA

Next
Next

【開催記録】ALIGN Webinar #9 Dr. Albert Webson: A Brief History of Pretraining and Post-Training Large Language Models