暗号的に拘束されたAIの「憲法」
AIモデルの重みをハッシュ化された「憲法」テキストに暗号的に結び付けることで、モデルの動作をその憲法に依存させる手法が提案されています。憲法の内容を変更するとモデルの重みが無効化されるため、憲法に従わない動作を防ぐことができます。この手法により、AIシステムの振る舞いを憲法に組み込むことができ、ポリシーではなく数学的に強制することが可能になります。
Like
Save
Cached
Comments
No comments yet
Be the first to comment