〈検索 Advent Calendar 9日目〉Googleの著作権侵害対策を読む
この記事は検索 Advent Calendar 9日目の記事である。
Googleの著作権侵害対策について
Googleは2016年9月に「Google の著作権侵害対策」(日本語版)のPDFを出している。
これはGoogleの様々なサービスの著作権に関する情報をまとめた62ページのPDFである。
PDFを読んだメモ
PDFを読んで検索に関して特に気になったところを箇条書きでメモしていく。
- Google検索は世界中で毎日35億回を超える検索がされている。
- GoogleはDMCAのノーティス・アンド・テイクダウンの運用改善のために色々な取り組みをしている
- Google検索がDMCAリクエストを処理するのに要する平均時間は6時間である。 2015年だけでDMCAの要件に従ってGoogleの検索結果から削除することを要請されたウェブページの数は5億5,800万であり、2014年から 60%増加している。Googleは、こうしたウェブページの98%以上を削除している。残りの2%弱の約1,100万ページに関しては、申し立てに不備がある、あるいは間違った申し立てであると判断し、却下している。GoogleではDMCA濫用の防止に向けた取り組みを特に重視している。
- 著作権侵害による削除通知の有効件数を検索結果のランキングを考慮する際の降格シグナルとして採用している。
- Googleでは、オートコンプリートと関連検索に著作権侵害との関連性が高い検索用語が表示されないよう措置を講じている。
- 検索と著作権侵害について
- 検索は著作権侵害サイトへのトラフィックの主要要因ではない。
- 検索を通じて著作権侵害サイトを撲滅することは不可能である。
- サイト全体の削除は非効率的であり、行き過ぎた検閲である。
- Follow the Moneyアプローチが効果的であることを強く主張している。
- Google検索で著作権侵害コンテンツを事前にフィルタリングするシステムは実現不可能なだけでなく、不必要でもある。
まとめ
〈検索 Advent Calendar 8日目〉Googleカスタム検索エンジンでキュレーションサイトを考慮した検索エンジンをつくる
この記事は検索 Advent Calendar 8日目の記事である。
キュレーションサイトについて
キュレーションサイトとは、情報を収集したものをある一定の分類に従ってまとめたサイトである。 まとめサイトと呼ばれることもある。
Googleカスタム検索エンジンとは
Googleカスタム検索エンジンとは、Googleの検索技術を用いて検索エンジンを作れたりカスタマイズできたりするものである。
キュレーションサイトを考慮した検索エンジンをつくってみる
Googleカスタム検索エンジンをつかってキュレーションサイトを考慮した検索をちょっと作ってみようと思う。
以下のリンクにとぶと検索が試せる。
https://cse.google.co.jp/cse/publicurl?cx=005442274983264151467:xuuxjdjlw5a
まだ作り始めたばかりなので全然整備が整ってないがちょくちょく直していければいいなと思ってる。
Googleカスタム検索エンジン、思ってた以上に色んなパラメータがあって楽しい。