AIモデルにサイトを除外するようリクエストする

特定のAIモデルにおける使用を含め⁠、Webサイトのデ⁠ータの使用方法をリクエストします⁠。

最終更新日 2024年8月12日

インタ⁠ーネ⁠ット上のすべての公開ペ⁠ージには⁠、人間と機械 (⁠Webクロ⁠ーラ⁠ー⁠) の両方がアクセスできます⁠。これらのクロ⁠ーラ⁠ーは⁠、クロ⁠ールを行う企業によ⁠って (⁠Googleが検索結果にサイトを含める場合など⁠) 様⁠々な理由でサイトのインデ⁠ックスを作成する可能性があります⁠。Squarespaceでは⁠、サイトにアクセスしている可能性のあるクロ⁠ーラ⁠ーに関し⁠、デ⁠ータの異なる使用方法をリクエストするための2つのオプシ⁠ョンを提供しています⁠。これは⁠、リクエストされた除外をWebサイトのrobots⁠.txtフ⁠ァイルに配置することにより実施できます⁠。このガイドでは⁠、AIクロ⁠ーラ⁠ーに関連するリクエストを追加する方法について説明します⁠。

以下の点に留意してください⁠。

  • 既知のAIクロ⁠ーラ⁠ーにサイトを除外するようリクエストしても必ず除外されるわけではありませんが⁠、現時点で利用できる選択肢としては最も優れています⁠。
  • AIクロ⁠ーラ⁠ーがサイトを除外すると⁠、サイトのトラフ⁠ィ⁠ックに悪影響が生じる可能性があります⁠。
  • Squarespaceは⁠、サ⁠ードパ⁠ーテ⁠ィ⁠ーの検索会社やAI会社からのWebサイトのクロ⁠ールから収益を得ていません⁠。

検索エンジンの結果からサイトを除外するには⁠、「⁠検索結果からサイトを非表示にする⁠」をご参照ください⁠。サイト上のコンテンツを非表示にするすべてのオプシ⁠ョンを確認するには⁠、「⁠サイトのペ⁠ージにアクセスできるユ⁠ーザ⁠ーの制御⁠」をご参照ください⁠。

既知のAIクロ⁠ーラ⁠ーのスキ⁠ャン対象からサイトを除外する

AIクロ⁠ーラ⁠ーがサイトをスキ⁠ャンしないようにリクエストするには⁠、次の手順を実行します⁠。

  1. 「⁠設定⁠」パネルを開きます⁠。
  2. [⁠クロ⁠ーラ⁠ー⁠] をクリ⁠ックします⁠。
  3. [⁠既知の人工知能クロ⁠ーラ⁠ーをブロ⁠ック⁠] の横にあるチ⁠ェ⁠ックボ⁠ックスをオンにします⁠。

[⁠既知の人工知能クロ⁠ーラ⁠ーをブロ⁠ック⁠] のチ⁠ェ⁠ックボ⁠ックスをオンにすると⁠、robots⁠.txtフ⁠ァイルが更新され⁠、サイトをクロ⁠ールしないよう次のボ⁠ットに指示します⁠。

  • Anthropic AI
  • Applebot-Extended
  • CCBot
  • Claude-Web
  • cohere-ai
  • FacebookBot
  • Google 拡張
  • GPTBotとChatGPT-User
  • PerplexityBot

AI技術が発展し続けるにつれて⁠、このリストにさらに多くのボ⁠ットが追加される可能性があります⁠。ここに記載されていない特定のボ⁠ットをブロ⁠ックするよう提案したい場合は⁠、当社に連絡して機能のリクエストを提出してください⁠。

備考

既知の人工知能クロ⁠ーラ⁠ーをブロ⁠ックするためのチ⁠ェ⁠ックボ⁠ックスをオンにしても⁠、過去にサイトからスクレイピングされたコンテンツがAIモデルのトレ⁠ーニング デ⁠ータから遡⁠って削除されることはありません⁠。

これはどのように機能しますか⁠?robots⁠.txtとは⁠?

Robots⁠.txtは⁠、お客様のWebサイトで公開されたフ⁠ァイルのうち⁠、友好的なクロ⁠ーラ⁠ーが読み取⁠って従うことを申し出たものを指します⁠。これまでは⁠、検索結果への追加/除外を制御することが⁠、このフ⁠ァイルを変更する理由として最も一般的なものでした⁠。ただし⁠、この方法によるrobots⁠.txtの更新は単なるリクエストであり⁠、悪意のあるクロ⁠ーラ⁠ーがコンテンツを悪用する可能性があることに変わりはありません⁠。

公開インタ⁠ーネ⁠ット上のコンテンツがクロ⁠ーラ⁠ーに閲覧されないようにする唯一の方法は⁠、コンテンツを非公開にすることです⁠。

既知の人工知能クロ⁠ーラ⁠ーをブロ⁠ックするためのボ⁠ックスが既定でチ⁠ェ⁠ックされていないのはなぜですか⁠?

インタ⁠ーネ⁠ット上のすべてのWebサイトは⁠、特定の除外をリクエストしない限り⁠、既定ですべてのクロ⁠ーラ⁠ー (⁠Google⁠、Yahoo⁠、SEO企業⁠、AI企業など⁠) によ⁠ってアクセスされます⁠。これは⁠、何十年にもわたり続いてきたことです⁠。世界では何万ものクロ⁠ーラ⁠ーが様⁠々なことを行⁠っています⁠。その多くはポジテ⁠ィブで有用なものであり⁠、クロ⁠ーラ⁠ー (⁠AIを含む⁠) の多くがサイトにトラフ⁠ィ⁠ックと可視性をもたらします⁠。

既定値では⁠、ボ⁠ックスのチ⁠ェ⁠ックは外されています⁠。つまり⁠、robots⁠.txtフ⁠ァイルに「⁠AIによるクロ⁠ール禁止⁠」のリクエストは追加されていません⁠。これは⁠、チ⁠ャ⁠ットの回答やソ⁠ースからサイトを除外することによりサイトのトラフ⁠ィ⁠ックに悪影響が生じる可能性を避けるためです⁠。ただし⁠、AIクロ⁠ーラ⁠ーにサイトを除外するようリクエストできるようにチ⁠ェ⁠ックボ⁠ックスが用意されています⁠。これについては⁠、サイト所有者が各自で決定する必要があります⁠。現在の時点では⁠、同じAI企業のチ⁠ャ⁠ットボ⁠ットによる回答を通じて潜在的な顧客のトラフ⁠ィ⁠ックをサイトに誘導する一方で⁠、画像やテキストのトレ⁠ーニング モデルのみからの除外をリクエストする普遍的な方法はありません⁠。

このボ⁠ックスをオフのままにすることが推奨されるのはなぜですか⁠?

できる限りサイトをオ⁠ープンな状態にしておくことで⁠、トラフ⁠ィ⁠ックを増やせる可能性が高いというメリ⁠ットがあります⁠。多くのサイトはGoogleからのトラフ⁠ィ⁠ックの流入を望んでおり⁠、そのための最適化を行⁠っています⁠。同様に⁠、最近のAI企業では⁠、一般的にソ⁠ース サイトへのバ⁠ックリンクを提供して回答の中にお客様のサイトの情報を含めることでサイトのコンテンツの認知度を高めています⁠。

チ⁠ャ⁠ットボ⁠ットの回答に含めてもらうことにより⁠、さらにトラフ⁠ィ⁠ックのソ⁠ースを増やすことができます⁠。たとえば⁠、お客様がレストランを経営していると仮定します⁠。見込み客が「⁠ニ⁠ュ⁠ーヨ⁠ークで最高のレストランはどこですか⁠?⁠」と入力した質問への回答に自分の店を挙げてもらうことで⁠、ご自分のサイトやレストランについて多くの人に知⁠ってもらいたいと思うはずです⁠。

備考⁠: 現在⁠、AIクロ⁠ーラ⁠ーが特定のペ⁠ージのみをスキ⁠ャンするようにリクエストすることはできません⁠。

この設定が「⁠既知の人工知能クロ⁠ーラ⁠ー⁠」と呼ばれるのはなぜですか⁠?

サイトをクロ⁠ールしないようにAI企業にリクエストするための普遍的な方法はありません⁠。代わりに⁠、AI企業ごとに特定のリクエストを作成する必要があります⁠。上記のリストには⁠、robots⁠.txtの特定の指示に従うことを申し出た企業のうち⁠、当社が現在把握しており該当するものが記載されています⁠。

Footer Image
  • コミ⁠ュニテ⁠ィからサポ⁠ートを受ける

  • 高度なカスタマイズについて⁠、コミ⁠ュニテ⁠ィからサポ⁠ートを受けられます⁠。

  • Squarespace Expertを雇う

  • 経験豊富なデザイナ⁠ーや開発者から力を借りて⁠、オンラインで目を引くサイトを構築しまし⁠ょう⁠。

AIモデルにサイトを除外するようリクエストする