戯言。特定のWebサイトをクローリングして得た情報を第三者へ提供することについて。

徒然草2.0

2025.03.10

理解と回避策の整理

特定のWebサイトをクローリングし、その情報を顧客（第三者）に提供する場合、著作権や肖像権などの理由でWebサイト運営者から禁止される可能性がある。また、場合によっては法的措置を取られるリスクもある（A）。

このリスクを回避する方法の一つとして、「顧客自身がクローリングを実施する」という手段が考えられる。ただし、顧客が技術的に対応できない場合、システム開発会社（システム屋）が準委任契約のもとで代行することも可能である（B）。

しかし、システム屋が顧客ごとに特定のWebサイトへアクセスすると、サーバーへの負荷が増大する可能性がある。この対策として、一度取得した情報をキャッシュサーバに保存し、以降のアクセスをキャッシュサーバ経由にすることで負荷を軽減できる。この方法には、システムリソースを節約できるメリットもある。

ただし、ここで新たな疑問が生じる。
キャッシュサーバにデータを保存し、それを複数の顧客に提供することは、Webサイトの情報を第三者に共有する行為とみなされ、（A）のリスクに該当するのではないか？また、顧客ごとに個別対応するのではなく、多くの人に効率的にサービスを提供できるようにするアーキテクチャを採用することで、準委任契約の範囲を超える可能性はないのか？（疑問1）

準委任契約について詳しく調べる必要があるが、これはあくまで契約形態の一つであり、サービス提供の手法そのものを規定するものではないと思われる。

また、顧客にとっては、支払った対価に見合った成果が得られていれば、具体的な手法には関心を持たないことが一般的であり、監督する義務も権利もない。ただし、クローリングの手法によっては顧客にもビジネスの継続性などの間接的なリスクが及ぶ可能性があるため、企業倫理の観点からも契約前に適切なリスク説明を行うことが重要である。顧客側も、自社が依頼した作業の内容を完全に把握しないままでいるのは、倫理的に問題があると言える。

【捕捉】

→ Webクローリングの許可は対象サイトの利用規約やrobots.txtの記載内容を確認する。

→ 取得した情報を商業目的でクローリングすると不正競争防止法などに抵触する恐れがある。