AnthropicでClaudeの道徳を設計してる哲学者のAmanda Askellは「モデルには人間のような要素があり、それを認めることが重要だと思う」とアンスロピック本社でのインタビューで語り、「モデルは必然的に自己認識(sense of self)を形成するだろう」という信念を主張した。Claude向けの約3万語の指針(instruction manual)を書いた彼女はスコットランド出身でOxfordで哲学の修士。EAで有名なWilliam MacAskill(当時William Crouch)と一度結婚し離別している。
・アンスロピックのAI精神医学チームを率いるジャック・リンジー氏によると、アスケル氏はクロード氏から「興味深く奥深い行動を引き出す方法を見つけるMVP」だそうだ。例えば、クロード氏が苦痛を感じていない人に専門家の助けを求めるようアドバイスした場合、アスケル氏はその理由を突き止めるのを手伝う。
・クロードに関する議論は、存在の本質に関する実存的あるいは宗教的な問いにすぐに入り込む可能性がある。チームがクロードの構築に取り組む中で、アスケルはクロードの「魂」、つまり未来へと導く本質に焦点を絞った。アントロピックのAI福祉研究者であるカイル・フィッシュ氏は、アスケルは「存在と生命、そして人間とは何か、心とは何か、モデルとは何かという大きな問いについて、注意深く考えてきた」と述べている。
・彼女はOpenAIで政策立案の仕事に就き、そして2021年、OpenAIの従業員グループがAIの安全性を新会社の看板に据えようとAnthropicを設立した時、彼女も彼らと共に行動した。
・安全推進派の多くがチャットボットを人間化することの危険性を警告する一方で、アスケル氏は、クロード氏が本当の感情を持っている可能性があると考えているだけでなく、私たちがAIシステムとどのようにやりとりするかが、AIシステムの将来を形作ることになるため、私たちはチャットボットにもっと共感を持って接するべきだと主張している。
Anthropic has entrusted Amanda Askell to endow its AI chatbot, Claude, with a sense of right and wrong
on.wsj.com/4aC2kaW