AIアライメントネットワーク一般社団法人 01/03/2025 AIアライメントネットワーク一般社団法人 01/03/2025

AGIの制御と好奇心：論文「Universal AI maximizes Variational Empowerment」公表

Ryuichi Maruyama 18/02/2025 Ryuichi Maruyama 18/02/2025

AIによる電力需要はどこまで増えるのか？～「AI電力問題」の予備的検討～

AIの電力問題（ないし環境問題）についてパースペクティブを得るため、公開情報をもとに予備的調査を行った。

Yusuke Hayashi 13/01/2025 Yusuke Hayashi 13/01/2025

【2025/1/15 10:00 開催】ALIGN Webinar #12 Jesse Hoogland : Singular Learning Theory for AI Safety

Hiroshi Yamakawa 30/12/2024 Hiroshi Yamakawa 30/12/2024

AIが“こっそり策略”を学ぶとき〜最新の研究が示す新時代のリスク〜

AIアライメントネットワーク一般社団法人 21/09/2024 AIアライメントネットワーク一般社団法人 21/09/2024

2024年AIアライメント入門コース参加報告

ALIGNボランティアスタッフの小林竜己（LangCloudテクノロジーズ）さんに2024年夏、ALIGN主催のAIアライメント入門コースの参加報告をいただきました。

Ryuichi Maruyama 03/09/2024 Ryuichi Maruyama 03/09/2024

【開催記録】ALIGN Webinar #11 David A. Dalrymple (davidad) : the Safeguarded AI program at ARIA

ALIGNウェビナー第11回では、英国ARIAの”Safeguarded AI Program”を率いるDavid A. Dalrymple氏をお招きし、Safeguarded AI Programと全貌と、その中核に位置する数学的なアイディアについて紹介いただきました。

Ryuichi Maruyama 19/08/2024 Ryuichi Maruyama 19/08/2024

【開催記録】ALIGN Webinar #10「LLMのアライメント技術」（ゲスト：今井翔太さん）

ALIGN Webinarの第10回ではAI研究者の今井翔太さんをお迎えしました。大規模言語モデル（LLM）のアライメント技術の代表的な手法であるRLHFとDPO（direct preference optimization）の関係性と比較、そして発展的な話題としてのAIによるフィードバック(RLAIF)の有効性などについて解説いただきました。

Ryuichi Maruyama 09/08/2024 Ryuichi Maruyama 09/08/2024

【開催記録】ALIGN Webinar #9 Dr. Albert Webson: A Brief History of Pretraining and Post-Training Large Language Models

ALIGNウェビナー第9回では、Google DeepMindのシニア・リサーチ・サイエンティストであるAlbert Webson博士をお招きし、現代の大規模言語モデル（LLM）の事前学習と事後学習（SFTとRLHF）について、AIアライメントの歴史との関連性を含めてお話いただきました。

Ryuichi Maruyama 18/07/2024 Ryuichi Maruyama 18/07/2024

【開催記録】ALIGN Webinar #8「SFから考える未来のAIリスク」（ゲスト：大澤博隆さん）

ALIGN Webinarの第8回では慶應義塾大学准教授の大澤博隆さんをお迎えし、HAIの分野における大澤さんの研究の来歴と、SFを研究テーマにし始めたきっかけ、そしてSFが未来のAIをどのように描いてきたのか、とりわけ、悪意のある使用、AI開発競争、組織的リスク、暴走AIといった「AIのリスク」の描かれ方について、LLMを使った最新の分析も交えて紹介いただきました。

Ryuichi Maruyama 06/07/2024 Ryuichi Maruyama 06/07/2024

【開催記録】ALIGN Webinar #7 「テクノロジーの〈解釈学〉」から考えるAI（ゲスト：小林茂さん）

第7回のALIGNウェビナーでは、情報科学芸術大学院大学（IAMAS）教授の小林茂さんをお迎えしました。本ウェビナーでは、2024年5月に「草稿第3版」としてWeb公開された書籍『テクノロジーの〈解釈学〉』をベースにポスト現象学、基礎情報学、ベルクソンの時間哲学などを紐解きながら、最先端のテクノロジーとしてのAIと私たちがどう対峙する際にこれらの哲学がどう導きになりうるかのアイディアを展開いただきました。また、小林さんの最近の研究活動とも紐づけながら、未完了な、「つつある時間」のなかでAIと人間の新たな関係性を模索していく可能性についても論じられました。

Ryuichi Maruyama 04/07/2024 Ryuichi Maruyama 04/07/2024

【開催記録】ALIGN Webinar #6 Evan Hadfield on AI and Democracy: Harnessing Collective Intelligence

ALIGNウェビナー第6回では、Collective Intelligence Project（CIP）のEvan Hadfieldさんをお迎えし、Collective Intelligence Projectのモチベーションや企業や政府と共同で手掛けている取り組みの紹介、さらにCI（collective intelligence）とAIの発展を発展させることで民主主義の変革につながるという大きなビジョンを共有いただきました。

Ryuichi Maruyama 24/06/2024 Ryuichi Maruyama 24/06/2024

【開催記録】ALIGN Webinar #5 「AIガバナンスとフェアネス」ゲスト：工藤郁子さん

ALIGNウェビナーで初の日本語開催となる第5回では、大阪大学社会技術共創研究センター特任准教授の工藤郁子（くどう・ふみこ）さんに講演いただきました。AI技術について法学と国際ルール形成の観点から見てこられた工藤さんより、近年のAIガバナンスの状況の大きな見取り図、そして重要論点としての「フェアネス」を取り上げ、顕在化しているバイアスの問題と、そもそもなぜバイアスが問題なのかに関する法学・倫理学からの分析を共有いただきました。

Ryuichi Maruyama 23/06/2024 Ryuichi Maruyama 23/06/2024

【開催記録】ALIGN Webinar #4 Dr. Ryan Kidd on AI Safety field building

第4回のALIGNウェビナーでは、ML Alignment & Theory Scholars (MATS) の共同ディレクターであり、London Initiative for Safe AI (LISA) の共同創設者のRyan Kidd 博士をお招きしました。Ryan氏はクイーンズランド大学で物理学の博士号を取得後、AI アライメントの分野構築（field building）に尽力されてきました。MATSプログラムは、若手研究者にAIアライメント分野に参入するための教育プログラムを提供することで、分野の発展に大きく貢献してきました。LISAはロンドンで活気あるコミュニティを形成しています。本ウェビナーでは、MATSとLISAの歩みとその成果について、AIの急速に発展の展望と、それに対処するための人材育成の在り方について伺いました。

bioshok 20/06/2024 bioshok 20/06/2024

「AIアライメント」小史――用語の発祥と歴史的背景

「AIアライメント」という言葉の発祥とその歴史的背景について、AIのもたらす深刻なリスクに関する発信を行っているエンジニアのbioshokさんに解説いただきました。

Ryuichi Maruyama 28/05/2024 Ryuichi Maruyama 28/05/2024

【開催記録】ALIGN Webinar #3 Dr. Evan Miyazono (Atlas Computing)

第3回のALIGNウェビナーでは、2023年に創設された非営利組織Atlas ComputingのCEO、Evan Miyazono博士をお招きしました。形式検証の手法に基づいた安全保証付きのAIの開発を目指すAtlas Computingを創設した狙いや、そしてMiyazono氏が長年取り組んできたメタサイエンス的視点から見たAI Safety分野の今後の発展の見通しについて伺いました。

Mari Izumikawa 28/05/2024 Mari Izumikawa 28/05/2024

【開催記録】ALIGN Webinar #2 Tan Zhi Xuan氏

2024年5月18日のALIGN Webinarシリーズの第2回では、マサチューセッツ工科大学（MIT）Probabilistic Computing Project and Computational Cognitive Science labの博士課程Tan Zhi Xuan氏をお招きしました。

Masayuki Nagai (Moon) 24/05/2024 Masayuki Nagai (Moon) 24/05/2024

【2024年7-8月開催】AI アライメント入門コース

2024年7～8月にALIGNが実施するAIアライメント入門コースの紹介。AIアライメントに関する基礎的および高度なトピックを深く理解するためにデザインされた、隔週で開催される4回のセッションからなるコースです。

Ryota Takatsuki 20/05/2024 Ryota Takatsuki 20/05/2024

英国政府が100億円超を投じる「Safeguarded AIプログラム」とは

2024年の4月にイギリスの政府系研究支援機関であるARIA（Advanced Research and Invention Agency）が、発表した“Safeguarded AI”プログラムについての解説記事です。

Ryuichi Maruyama 29/05/2019 Ryuichi Maruyama 29/05/2019

【開催記録】ALIGN Webinar #1 Dan Hendrycks博士（Center for AI Safety）

2024年5月17日のALIGN Webinarシリーズの第1回では、Center for AI Safety（CAIS）の創設者であり、AIセーフティの分野の技術的研究や提言活動で世界を先導する一人であるDan Hendrycks（ダン・ヘンドリックス）博士をお招きしました。