TLDR; この記事は、DALL·Eのような生成型AIモデルにおけるAI幻覚の驚くべき創造的可能性を探求します。通常、深層学習の欠陥と見なされますが、これらの「エラー」は予期せぬ芸術的輝きを生み出すことができます。人間の想像力とAIのパターンベースの論理を比較することで、この作品は、AIの虚偽が実際に新しい種類の創造性であるかどうかを疑問視します。
幻覚AIモデル深い学習人工知能
What Does It Mean for AI to “Hallucinate”?
「Hallucinate」とはどういう意味ですか?用語幻覚オックスフォード先進学者辞典によると、幻覚は、
「病気や薬物のせいで、実際にそこにいない誰かや何かを見たり聞いたりするという事実」
「病気や薬物のせいで、実際にそこにいない誰かや何かを見たり聞いたりするという事実」
言い換えれば、幻覚は通常、間違った感覚と関連付けられています - 恐れられることや固定されること。
生成型AIの世界では、意味がそれほど異なるわけではありません。ChatGPTのようなLLM(Large Language Model)やDALL-Eのような生成型AIのモデルが「幻覚」であると言われる場合、それは生成したことを意味します。誤りあるいは誤った情報こうした影響は深刻なものであり、モデルを完全に信頼することは決してできない、潜在的なリスクは?誤解する事実、危険なアドバイス、または破損したソフトウェア。
誤りあるいは誤った情報
When Hallucination Goes Too Far
幻覚が遠くまで進むとき暗い側から始めましょう. あなたが一度も訪れたことがない街でロマンチックな夜を計画していると想像してください. あなたはChatGPTにレストランを推薦し、有望な場所のリストから選択するように依頼します. しかし、あなたが到着したとき - すべての衣装を着て - あなたは指定された場所にレストランが存在しないことを発見します. さらに、それはどの場所にも存在しません。
やっぱりダメなんですけど、比較的ダメな例です。
さらに有害なシナリオを考えてみましょう:
- 医療の誤った情報は、間違った診断や治療につながります。
- 生徒に課金した歴史的な不正確さ。
- システム全体を破壊するコードエラー
- 誤った解釈による自動運転障害
AIの幻覚は、単に虚構の副作用ではなく、彼らは持っているかもしれません。real-world consequences.
The Pentagon That Wasn’t
なかったペンタゴン2年前、検証済みのTwitterアカウント(現在のX)が爆発のイメージ写真は、建物の隣の煙の雲を示しました。ペンタゴンこのツイートはウイルスとなり、急速な市場反応を引き起こし、ダウジョーンズはわずか4分で85ポイント下落した。
こちらはピックル - 画像は偽物でした。
こちらはピックル - 画像は偽物でした。
画像はAIによって生成された可能性があり、爆発は決して起こらなかったが、それが解消された時点で、the financial damage had already been done.
このイメージを生み出したのは人間の命令によるプロンプトなのか、あるいはモデルの幻覚なのかは明らかではないが、どちらの方法でも結果は同じだった。
When Bots Make Up Policy
ボットが政策を作る時最近、Cursor の AI サポート ボットは、このツールが 1 台以上のマシンで使用できないことをユーザーに通知しました。その結果、ユーザーは文句を言い、一部はサブスクリプションをキャンセルした。
たった一つの問題がありました:it wasn’t true.
CursorのCEOは後で「我々はそのようなポリシーを持っていません。あなたはもちろん、複数のマシンでCursorを使用する自由です」誰が責任を持っていたか、あなたは尋ねますか? 「残念ながら、これは前線のAIサポートボットからの間違った回答です」CEOは述べました。
したがって、基本的に、AIは薄い空気から政策を発明しました。
The Courtroom Catastrophe
裁判所災害最も有名な例:Two 弁護士は法的ブリートの作成に役立つためにChatGPTを使用しました。引用されたモデルcompletely fabricated legal cases弁護士たちは、それを知らずに連邦裁判官に提出した結果? 制裁、罰金、そして国民の恥辱。
裁判官は、彼らは「責任を放棄した」とし、尋問を受けた後も偽りの引用に立ち続けたと述べた。
Can a Hallucination Be… Good?
幻覚は・・・良いものなのか?これらの例は、一つの結論を強調する:AI cannot be trusted blindlyすべての出力は、どれほど説得力があり自信を持って聞こえるかにかかわらず、二重チェックされなければなりません。人間を完全に信頼できるのか?
人間を完全に信頼できるのか?
では、幻覚を別の角度から見るとどうでしょうか。
テクノロジーの歴史の中で最もビジョンを持った心の1つ - 文字通り私たちが暮らす世界を形作るのに役立った人物 - は、幻覚を抱くことで知られていました。
アップルの共同創設者であるスティーブ・ジョブズは、創造的な思考を広げるために、LSDのような精神薬を公然と認めた。
彼を愛するか、彼を憎むか、誰も彼の影響の規模を否定できない。彼は単に製品を作ったのではなく、彼のビジョンに匹敵するために現実を曲げた。
Jobs, LSD, and Creativity
仕事、LSD、そして創造性Steve Jobs openly credited his creative breakthroughs to psychedelic experiences. ウォルター・アイザクソンの生涯誌Steve Jobs彼は言う。
「LSDを摂取することは、私の人生で最も重要なことの1つであり、深い経験でした。LSDは、コインのもう一つの側面があることを示しています、そしてあなたはそれを覚えていませんが、あなたはそれを知っています。
「LSDを摂取することは、私の人生で最も重要なことの1つであり、深い経験でした。LSDは、コインのもう一つの側面があることを示しています、そしてあなたはそれを覚えていませんが、あなたはそれを知っています。
もし幻覚が人間が世界を異なって見るのを助けることができるなら、AI幻覚が同じ目的を果たすことができるだろうか。
When Hallucination Becomes a Creative Compass
幻覚がクリエイティブなコンパスになるとき正しい文脈に置かれた幻覚は、ただの欠点以上のものなのかもしれないか。想像力芸術、ストーリーストーリー、またはデザインなどのビジョンに精度が次元的な領域では、おそらくバグではなく、予期せぬ機能を見ているかもしれません。
私の前の記事で, I explored how DALL-E's so-called hallucinations turned rough children's sketches into vibrant, full-fledged illustrations. The AI filled in the gaps not with facts, but with flair - interpreting rather than replicating. DALL-E's so-called hallucinations turned rough children's sketches into vibrant, full-fledged illustrations. AI filled in the gaps not with facts, but with flair - interpreting rather than replicating. I explored how DALL-E's so-called hallucinations turned rough children's sketches into vibrant, full-fled illustrations. AI filled the gaps not with facts, but with flair.
しかし、さらに進むことはできますか。
しかし、さらに進むことはできますか。
アーティストとして、私はクリエイティブなブロックの重みを知っています。それは静かに浮かび上がり、それから必要以上に長く続きます。あなたがオリジナリティを強制しようとしているほど、あなたのアイデアは、安全で予測可能でインスピレーションを受けずに、同じよく知られているパターンに戻ります。
もし生成型AIが単なるツールではなく、一種のクリエイティブ医学人間の想像力を置き換えるのではなく、人間の想像力を揺さぶるためでなく、自分たちで歩むべき道を示すためでもないかもしれない。surprise.
Logic Is Your Enemy
論理はあなたの敵わたしたちの心は、一貫性.
城を見ると、姫を想像する、犬を追いかける、おそらくボールを追いかける、子供を抱く、テディー熊を抱く。
この自動パターン認識は日常生活に非常に役立ちます - それは私たちが世界を迅速かつ効率的に移動するのに役立ちます。boxes私たちの脳の中、その箱はlimit私たちの創造的潜在力
The Categorisation Trap: Your Brain Loves a Story
タイトル: Your Brain Loves a Story以下のカードを見てみましょう。
さて、私があなたに3つのカテゴリーに分類するように頼んだと想像してみてください. Most minds would instantly see this:
- A night sky with the moon, a cloud, and a star
- A tea party scene with a table, a slice of cake, and maybe a tea pot
- A forest with a fox, a tree, and a mushroom. 狐と木と真菌の森
あなたは変異を追加することができます - おそらくあなたの狐は真菌を嗅ぎ、またはおそらくあなたが平均的な人よりもクリエイティブであれば、それはキャンプファイアの隣に座り、それを棒に焼き付ける。we still stick to the script文脈は私たちを枠組みに閉じ込めます。
そして、誰もが同じフレームワークから働いているとき、ユニークさは少しずつ死ぬ。
Breaking the Context (on purpose)
文脈を破る(意図的に)さて、これを壊そう。
予想を振り回し、論理的な本能を窓から投げ出す。無限の創造性のために論理に挑戦しよう。
代わりにこのグループをイメージしてください:
-
A moon
-
A fox
-
A table
まさか脳が止まってしまったんですよね。
おそらくあなたは視覚を作成することができなかったでしょう。もしくは、そうした場合、それは分離され、馬鹿げた、さえも不快な感じでした。
何が嫌いなのだろうか? まあ、生産性は?
代わりに以下のグループを紹介します。
そして今、DALL-E 3の無限の想像力を楽しもう。
Starts Celebrating Birthday with a Mushroom Cake
バースデーをキノコケーキで始める
Tree Drinking Tea inside a Cloud
雲の中の紅茶を飲む木
Fox and Moon Tea Party
フォックス&ムーンティーパーティー
Free from Human Logic
人間の論理から解放されるDALL-Eは、現実世界で一度も起こらない概念(幻覚)を簡単に組み合わせることができました。
なぜ、私たちの心と彼の思考の間には、このような違いがあるのでしょうか。
人間は、理性に基づいて、meaning, coherence, and lived experience月、狐、テーブルを含むシーンを想像するよう求められたとき、私たちの脳は本能的に試みます。make sense of the combinationわれわれの心は論理、文脈、あるいは比を探し求め、それを見つけることができないとき、われわれはしばしば立ち止まったり諦めたりする。optimised for relevance偶然ではない。
DALL-Eは、個人的な記憶や線形論理に依存していません。billions of images and captionsそれを暴露するためにcountless visual combinations -彼らの多くは珍しい、あるいは超現実的なので、あなたが月、狐、テーブルのような無関係な要素でそれを促すとき、それは接続が「意味があるかどうか」を躊躇したり疑問に思ったりしません。statistical patternsこれらの物体がどのように現れたかtogether, near each other, or in similar visual contexts間接的にでも。
言い換えれば、
- 人間には一貫性が必要です。
- DALL-Eは単にコラレーションが必要です。
そしてそこにその力がある:人間の論理や内なる一貫性の必要性から解放されることによって、DALL-Eはconfidently generate the absurd, the poetic, or the beautifully strange -2 自己推測なし
A Human’s Muse
人間のムーア私たちは幻覚を恐れるように教えられています - 多くの分野で正しいことです. 医学、法律、歴史、および安全に重要なシステムでは、AIは真理の高い基準に留まらなければなりません。
AIを事実上のソースとして信頼できない「欠点」こそが、それがAIとして強力なものになるのかもしれない。creative companion右手の幻覚は、まったく別のものになる:a spark.
DALL-Eが狐、月、そしてテーブルを「誤解」したとき、それは失敗しません。daresそれは私たちに論理を解き放ち、物語を手放し、可能性を抱きしめるときに何が起こるかを見ることを招きます。
この現象は、私たちの心の文脈と論理を解放するのに役立つことによって、アーティストのブロックを癒すことができます、それは創造性を高め、私たちの把握を超えていたかもしれないアイデアを刺激することができます。
だから、本当の疑問は「AIが幻覚化するのを止めることはできないか」ではないのかもしれません。
もしかしたら、私たちが夢を見るのを許す時、私たちは何を建てることができますか?
もしかしたら:What can we build when we let it dream?
わたしについて
わたしについて私はMaria Piterberg - ハバナラボス(Intel)のRuntimeソフトウェアチームを率いるAI専門家であり、伝統的およびデジタルメディアで働く半プロのアーティストです。私はコミュニケーションライブラリ(HCCL)とランタイム最適化を含む大規模なAIトレーニングシステムに特化しています。