【開催記録】ALIGN Webinar #10「LLMのアライメント技術」（ゲスト：今井翔太さん）

19 Aug

第10回のALIGNウェビナーでは、AI研究者の今井翔太さんにご講演いただきました。

日時：2024年8月19日（月）5:00 pm-6:00 pm （日本時間）
参加者：オンラインで90名ほど

今井さんは、東京大学松尾研究室にてAI研究に従事され、現在は新たな挑戦に向けて準備中。強化学習、マルチエージェント、生成AI、LLM、ゲームAIなどを専門に研究を展開され、2024年1月には、単著『生成AIで世界はこう変わる』（SB新書）を刊行されました。

本ウェビナーでは、大規模言語モデル（LLM）のアライメント技術をテーマとしし、その代表的な手法であるRLHFとDPO (direct preference optimization)の関係性と比較、そして発展的な話題としてのAIによるフィードバック（RLAIF）の有効性などについて解説いただきました。

本講演のスライド資料を後日公開予定です。

Webinar

Ryuichi Maruyama

【開催記録】ALIGN Webinar #10「LLMのアライメント技術」（ゲスト：今井翔太さん）

【開催記録】ALIGN Webinar #11 David A. Dalrymple (davidad) : the Safeguarded AI program at ARIA

【開催記録】ALIGN Webinar #9 Dr. Albert Webson: A Brief History of Pretraining and Post-Training Large Language Models