人工知能 (AI) は、特に文章コンテンツの生成において、現代の生活を席巻しています。楽しいことばかりですが、AI コンテンツの検出精度の低さは憂慮すべきものです。さらに悪いことに、AI 検出器は人間が書いたコンテンツを GPT 生成としてマークします。米国憲法を例に挙げましょう。

関連記事:Yコンビネーターのポール・グラハム、「Delve」を使ったテキストはAIによって書かれたと主張して非難される

アメリカ合衆国憲法は 1787 年に起草され、1788 年に批准され、1789 年から施行されています。これは世界で最も長く存続している文書化された政府憲章です。憲法は最初の自動車が発明される約 1 世紀前に制定されました。しかし、AI 検出器は憲法が 97.97% AI によって生成されたものであると判定しました。

AI検出器が米国憲法を非人道的と判定

2023 年には、人工知能コンテンツが増加しました。その後すぐに、市場開発者は AI コンテンツの割合を通知する検出器を作成する機会を得ました。これは良い進歩であるはずでしたが、そうではありませんでした。

AI 検出器が米国憲法を AI コンテンツとしてマークしました。その割合はなんと 97.97% です。「人工知能」という用語は、1950 年から 1956 年にかけて AI が誕生した頃に造られ、普及しました。では、AI はどのようにして、その発明より 163 年も古い文書を作成したのでしょうか。

出典: Zerogpt.com

1950 年、アラン チューリングは「コンピュータの機械と知能」と題する論文を発表し、「模倣ゲーム」と呼ばれる機械知能のテストを提案しました。この記事は、私たちが現在住んでいる世界の始まりを示しました。

1952年、アーサー・サミュエルというコンピューター科学者がチェッカーをプレイするプログラムを開発しました。これは、チェッカーを自力で学習した最初の人物です。その後すぐに、1955年にジョン・マッカーシーがダートマス大学で「人工知能」に関するワークショップを開催し、これが「人工知能」という言葉が初めて使用されたきっかけとなりました。

AI検出器には限界がある

AI 検出器には限界があります。AI が生成したテキストは人間の文章を模倣するからです。これらの検出器は、機械に文章の書き方を教えたのと同じ人間によってトレーニングされています。では、AI 検出器はどのように機能し、どれほど正確なのでしょうか。別の AI 検出器は、米国憲法に 1% の AI コンテンツがあると評価しました。この 1% はどこから来たのでしょうか。

出典: gptzero.me

さて、ここに相違点があります。一部の AI 検出器は、「delve、tapestry、utilize、numerous など」のような、通常は AI が使用するがアメリカ人にはあまり一般的ではない特定の単語に注意を払います。

しかし、イギリスの植民地時代の歴史を持つ国出身の人々の中には、これらの単語が話し言葉と書き言葉の両方で一般的に使用されている人もいます。

先月、Y Combinator の共同設立者ポール・グラハム氏は、X (旧 Twitter) で発表した ChatGPT テキスト属性理論をめぐって非難を浴びた。グラハム氏は、あるプロジェクトについて誰かから受け取ったコールド メールの提案を投稿した。その提案には「delve」という単語が含まれていたため、AI ライティングであると結論付けた。

X ユーザーの 1 人は、「イギリス植民地時代のある国で英語を学んだ人たちは、まさにこのようにして英語を学んだのです。[…]『Delve』は私たちが話す普通の言葉です」とコメントしました。別のユーザーは、これはアメリカの問題だと述べました。

一部の国や人々は、いまだに「文学英語」とでも言うべき英語を使っています。残念なことに、アメリカの語彙は主に口語表現(俗語と呼ぶもの)とアメリカの現代慣用句に基づいており、その洗練された使用法は…

— アフリカリサーチデスク (@MightiJamie) 2024年4月10日

こうなると、AI 検出器とコンテンツ ジェネレーターは地域英語に特化すべきかという疑問が生じます。それとも、こうしたライティング ツールと検出器はすべて廃止すべきでしょうか。

AI検出器は不正確

AI 検出器は、一貫性のない言語的特徴に依存しています。人間の言語は本質的に変化に富んでおり、スタイル、方言、慣用句が多岐にわたります。AI が生成したテキストもこれらのバリエーションに該当する可能性があるため、検出器の精度を上げるのは困難です。

AI が生成したテキストの約 20% は、これらの検出システムを検出されずに通過し、AI 検出器の信頼性を損ないます。同様に、人間が書いたテキストの約 25% が誤って AI としてフラグ付けされます。

Quora のユーザー 1 人が、「AI 検出器が私の作品を 100% AI 生成だと検出しています。学術アドバイザーの依頼で、無意識のうちに編集および文法ツールとして使用したためです。すでに公開されている作品の言葉、概念、人生経験は私自身のものです。どうすればいいでしょうか?」と書いています。

この問題に不満を表明する人は多い。最近、Cryptopolitan が掲載したニュース記事で、AI ジェネレーターがドナルド トランプ氏の発言にフラグを立てた。トランプ氏は「私は暗号通貨企業や、この新しく急成長している業界に関連するすべてのことに非常に前向きでオープンな姿勢だ」と述べた。⁤AI はどのようにして話し言葉に追加されるのか? それは人の心の中にあるのか? 表現された思考の中にあるのか?

他には、デイビッド・ベイリーの次のような内容もありました。「⁤私たちは自らを守るために動員されます。⁤⁤私たちはトランプ氏に投票しているのではなく、バイデン氏に反対票を投じているのです。⁤⁤その責任はバイデン氏だけにあります。」

こちらもお読みください: トランプの暗号通貨キャンペーン – 知っておくべきことすべて

2023年、OpenAIはプロモーションブログ投稿で教育者向けのヒントを公開し、一部の教師がChatGPTを教育補助としてどのように使用しているかを示しました。

FAQ の「AI 検出器は機能しますか?」というセクションで、OpenAI は「簡単に言えば、いいえ。一部のツール (OpenAI を含む) は AI 生成コンテンツを検出すると称するツールをリリースしていますが、AI 生成コンテンツと人間生成コンテンツを確実に区別できることが証明されたツールはありません」と書いています。人間によるコンテンツと AI コンテンツを区別するという問題は残っています。問題は、今後何をすべきかということです。

クリプトポリタンのフロレンス・ムチャイ記者によるレポート