2024年AIアライメント入門コース 参加報告
ALIGNボランティアスタッフの小林竜己(LangCloudテクノロジーズ)さんに2024年夏、ALIGN主催のAIアライメント入門コースの参加報告をいただきました。
【開催記録】ALIGN Webinar #11 David A. Dalrymple (davidad) : the Safeguarded AI program at ARIA
ALIGNウェビナー第11回では、英国ARIAの”Safeguarded AI Program”を率いるDavid A. Dalrymple氏をお招きし、Safeguarded AI Programと全貌と、その中核に位置する数学的なアイディアについて紹介いただきました。
【開催記録】ALIGN Webinar #10「LLMのアライメント技術」(ゲスト:今井翔太さん)
ALIGN Webinarの第10回ではAI研究者の今井翔太さんをお迎えしました。大規模言語モデル(LLM)のアライメント技術の代表的な手法であるRLHFとDPO(direct preference optimization)の関係性と比較、そして発展的な話題としてのAIによるフィードバック(RLAIF)の有効性などについて解説いただきました。
【開催記録】ALIGN Webinar #9 Dr. Albert Webson: A Brief History of Pretraining and Post-Training Large Language Models
ALIGNウェビナー第9回では、Google DeepMindのシニア・リサーチ・サイエンティストであるAlbert Webson博士をお招きし、現代の大規模言語モデル(LLM)の事前学習と事後学習(SFTとRLHF)について、AIアライメントの歴史との関連性を含めてお話いただきました。
【開催記録】ALIGN Webinar #8「SFから考える未来のAIリスク」(ゲスト:大澤博隆さん)
ALIGN Webinarの第8回では慶應義塾大学准教授の大澤博隆さんをお迎えし、HAIの分野における大澤さんの研究の来歴と、SFを研究テーマにし始めたきっかけ、そしてSFが未来のAIをどのように描いてきたのか、とりわけ、悪意のある使用、AI開発競争、組織的リスク、暴走AIといった「AIのリスク」の描かれ方について、LLMを使った最新の分析も交えて紹介いただきました。
【開催記録】ALIGN Webinar #7 「テクノロジーの〈解釈学〉」から考えるAI(ゲスト:小林茂さん)
第7回のALIGNウェビナーでは、情報科学芸術大学院大学(IAMAS)教授の小林茂さんをお迎えしました。 本ウェビナーでは、2024年5月に「草稿第3版」としてWeb公開された書籍『テクノロジーの〈解釈学〉』をベースにポスト現象学、基礎情報学、ベルクソンの時間哲学などを紐解きながら、最先端のテクノロジーとしてのAIと私たちがどう対峙する際にこれらの哲学がどう導きになりうるかのアイディアを展開いただきました。また、小林さんの最近の研究活動とも紐づけながら、未完了な、「つつある時間」のなかでAIと人間の新たな関係性を模索していく可能性についても論じられました。
【開催記録】ALIGN Webinar #6 Evan Hadfield on AI and Democracy: Harnessing Collective Intelligence
ALIGNウェビナー第6回では、Collective Intelligence Project(CIP)のEvan Hadfieldさんをお迎えし、Collective Intelligence Projectのモチベーションや企業や政府と共同で手掛けている取り組みの紹介、さらにCI(collective intelligence)とAIの発展を発展させることで民主主義の変革につながるという大きなビジョンを共有いただきました。
【開催記録】ALIGN Webinar #5 「AIガバナンスとフェアネス」ゲスト:工藤郁子さん
ALIGNウェビナーで初の日本語開催となる第5回では、大阪大学社会技術共創研究センター特任准教授の工藤郁子(くどう・ふみこ)さんに講演いただきました。AI技術について法学と国際ルール形成の観点から見てこられた工藤さんより、近年のAIガバナンスの状況の大きな見取り図、そして重要論点としての「フェアネス」を取り上げ、顕在化しているバイアスの問題と、そもそもなぜバイアスが問題なのかに関する法学・倫理学からの分析を共有いただきました。
【開催記録】ALIGN Webinar #4 Dr. Ryan Kidd on AI Safety field building
第4回のALIGNウェビナーでは、ML Alignment & Theory Scholars (MATS) の共同ディレクターであり、London Initiative for Safe AI (LISA) の共同創設者のRyan Kidd 博士をお招きしました。Ryan氏はクイーンズランド大学で物理学の博士号を取得後、AI アライメントの分野構築(field building)に尽力されてきました。MATSプログラムは、若手研究者にAIアライメント分野に参入するための教育プログラムを提供することで、分野の発展に大きく貢献してきました。LISAはロンドンで活気あるコミュニティを形成しています。本ウェビナーでは、MATSとLISAの歩みとその成果について、AIの急速に発展の展望と、それに対処するための人材育成の在り方について伺いました。
「AIアライメント」小史――用語の発祥と歴史的背景
「AIアライメント」という言葉の発祥とその歴史的背景について、AIのもたらす深刻なリスクに関する発信を行っているエンジニアのbioshokさんに解説いただきました。
【開催記録】ALIGN Webinar #3 Dr. Evan Miyazono (Atlas Computing)
第3回のALIGNウェビナーでは、2023年に創設された非営利組織Atlas ComputingのCEO、Evan Miyazono博士をお招きしました。形式検証の手法に基づいた安全保証付きのAIの開発を目指すAtlas Computingを創設した狙いや、そしてMiyazono氏が長年取り組んできたメタサイエンス的視点から見たAI Safety分野の今後の発展の見通しについて伺いました。
【開催記録】ALIGN Webinar #2 Tan Zhi Xuan氏
2024年5月18日のALIGN Webinarシリーズの第2回では、マサチューセッツ工科大学(MIT)Probabilistic Computing Project and Computational Cognitive Science labの博士課程Tan Zhi Xuan氏をお招きしました。
【2024年7-8月開催】AI アライメント入門コース
2024年7~8月にALIGNが実施するAIアライメント入門コースの紹介。AIアライメントに関する基礎的および高度なトピックを深く理解するためにデザインされた、隔週で開催される4回のセッションからなるコースです。
英国政府が100億円超を投じる「Safeguarded AIプログラム」とは
2024年の4月にイギリスの政府系研究支援機関であるARIA(Advanced Research and Invention Agency)が、発表した“Safeguarded AI”プログラムについての解説記事です。
【開催記録】ALIGN Webinar #1 Dan Hendrycks博士(Center for AI Safety)
2024年5月17日のALIGN Webinarシリーズの第1回では、Center for AI Safety(CAIS)の創設者であり、AIセーフティの分野の技術的研究や提言活動で世界を先導する一人であるDan Hendrycks(ダン・ヘンドリックス)博士をお招きしました。