Google検索の「このサイトはコンピュータに損害を与える可能性があります」について

Google検索の公式ヘルプページ 「このサイトはコンピュータに損害を与える可能性があります」という通知メッセージ を読む。

support.google.com

Google検索をしてると検索結果のページURLとスニペットの間に このサイトはコンピュータに損害を与える可能性があります
というメッセージが表示されることがある。このメッセージが表示されているサイトにアクセスすると不正なソフトウェアがインストールされる可能性がある。

「このサイトは第三者によってハッキングされている可能性があります」と「このサイトはコンピュータに損害を与える可能性があります」の明確な違いがなんだろうと気になったのが今回調べるにあたった経緯だ。

sakura818uuu.hatenadiary.com

ウェブマスター(サイトの管理者)が自分の管理しているサイトでこのメッセージが表示された場合、Google Search Consoleを使って原因の問題を修正してセキュリティの問題という項目で再審査リクエストを行えばよいようだ。

ユーザーがメッセージを発見した場合はGoogleは以下のような見解を述べている。

Google では、Google の検索結果にこのメッセージが表示されなくなるまで当該ウェブサイトにアクセスしないことをおすすめしています。

また、もしも該当のウェブサイトにいってしまい不正なソフトウェアがダウンロードされたと思われる場合は以下のような見解を述べている。

注: このようなウェブサイトからパソコンに不正なソフトウェアがダウンロードされたと思われる場合は、不正ダウンロードを報告する方法と端末をクリーンな状態に保つ方法をご確認ください。

f:id:sakura818uuu:20171121011502p:plain
不正ダウンロードを報告する場合はGoogle公式の報告フォーム Report malicious software に送信する

f:id:sakura818uuu:20171121011713p:plain
端末をクリーンな情報に保つ場合はGoogle Safety Centerというページが設けられているのでそこを見るとよい

で結局「このサイトは第三者によってハッキングされている可能性があります」と「このサイトはコンピュータに損害を与える可能性があります」の明確な違いはなんなんだということだ。ウェブマスター向けの公式ヘルプページに以下の様なことが書いてあった。

スパムを含むハッキング  |  ハッキングされたとき  |  Google Developers

通常は検索結果に「このサイトは第三者によってハッキングされている可能性があります」という警告が表示されます。これは、復旧プロセスで最も長いステップの 1 つです。サイト上の被害を受けたファイルのリストをこのステップで作成します。リストは、後のサイトの問題を修正して管理するステップで使用します。

サイトがマルウェアで侵害された場合は、検索結果に「このサイトはコンピュータに損害を与える可能性があります」という警告が表示されます。

どうやらマルウェアの場合は「このサイトはコンピュータに損害を与える可能性があります」としているようだ。これを聞いても正直線引?というかんじはある。Google Search Consoleではより詳しく問題の詳細が記載されていると思うので、そちら側の基準で決めているのかもしれない。

※ハッキングとは広義にエンジニアリングを指す言葉である。ここではおそらく他のサイトに侵入する意味でハッキングという言葉を用いているのだと考えられる(他の言葉でいうとクラッキングが近い)。
マルウェアとは広義に不正な動きをするソフトウェアや悪質なコードを指す言葉である。マルウェアには、聞き馴染みの深いウイルス・ワーム・トロイの木馬バックドアなど含まれる。

まとめとして「このサイトはコンピュータに損害を与える可能性があります」というメッセージが表示されているサイトに対してユーザーがGoogleに報告するフォームなどは特になく、行動としてはアクセスしないのが一番の選択だろうということだ。 もしも不正なソフトウェアがダウンロードされたと思われる場合は、Report malicious softwareにレポートを送るかGoogle Safety Centerを確認するとよい。

「このサイトは第三者によってハッキングされている可能性があります」と「このサイトはコンピュータに損害を与える可能性があります」の違いは、後者のほうがマルウェアで侵害された場合を指す。

Google検索の How Search Works のページの日本語版がでたので読む

Google検索の How Search Works のページの日本語版がでたので読んで気になったところをメモする。

www.google.com

f:id:sakura818uuu:20171120113816p:plain
How Search Works 日本語版のトップページ


トップページの概要に、検索に対する Google の方針として3つのコアバリューについて紹介されている。

  • ユーザーを最優先する
  • ウェブサイトの所有者をサポートする
  • 情報アクセスの機会を最大限確保する

f:id:sakura818uuu:20171120114305p:plain
Google検索の3つのコアバリュー


www.google.com

上記はクロールとインデックス登録のページである。

Google 検索のインデックスには数千億ものウェブページが登録されており、そのサイズは優に 1 億ギガバイトを超えます。

数千億…

Google 検索では現在、主要な図書館に所蔵されている何百万冊という書籍からテキストを検索したり、地域の公共交通機関の移動時間を調べたり、世界銀行などの一般公開されている情報のデータを検索したりすることができます。

Google ブックスのプロジェクトが進んでると捉えていいんだろうか…。Google ブックス個人的にとても応援しているのでもっとよくなるとうれしい: )


www.google.com

上記はアルゴリズムのページである。

たとえば、1 つの単語に複数の定義がある場合でも検索がユーザーの意図を理解できるのは Google の類義語システムのおかげです。このシステムは開発に 5 年以上かかりましたが、さまざまな言語の検索の 30% 以上で大きな成果を上げています。

これ知らなかった。論文とかで発表しているのであればぜひぜひ見たい


www.google.com

上記は便利な検索サービスのページである。

2016 年だけでおよそ 1,600 件の改良が Google 検索に追加されましたが、これらは Google 検索を改善するための長年にわたる努力のほんの一部にすぎません。

正確には1,653 件らしい。(後のユーザーを最優先するページに記載されている)

Google は 2012 年にナレッジグラフを導入しました。ナレッジグラフは、10 億件を超える現実世界の人物、場所、物事と、それらに関する 500 億件を超える事実とその関係性で構成される Google のデータベースです。

ナレッジグラフって2012年からだったのか。昔見たTED(下のブログに記載)で検索は事実を尋ねるものと知識を尋ねるものの2種類に分けられるっていうのがあったけど、事実の検索はナレッジグラフが網羅しそうだ…

sakura818uuu.hatenadiary.com

尋ねる前に情報が手に入る

うむむ…便利だ…

Google では現在、毎年何兆件もの検索を処理しています。Google が毎日処理する検索クエリの 15% はそれまでに見たことのないものです。

そうなのか…! 15%は想像していたよりもとても大きな数字だ


www.google.com

上記はユーザーを最優先するのページだ。

まず、ページにのっていたこの動画がすごく面白かった。私は検索がとても大好きだけど、恥ずかしながらこの動画を見たことがなかった。私にとってとても興味深い内容だった。

www.youtube.com

2016 年には、検索に熟練した外部の評価者によるテストや本番環境でのユーザーテストなど、合計 15 万件以上のテストを実施し、1,600 を超える変更を加えて検索を改良しました。

15万件のテスト(130,336 件の検索品質評価テスト+18,015 件の比較テスト+9,800 件のライブ トラフィック テスト)、これもとても大きな数字だ。外部の評価者ってのはinternet assessorとかも含んでいるのかな…。

www.google.com

上記はサイトの所有者をサポートするのページだ。

安全で便利なウェブを守るためのウェブスパムとの戦いは、毎日が挑戦です。Google では検索の仕組みについて透明性を確保したいと考えています。しかしその一方、情報公開を進めすぎると、検索結果を操作して検索の質を低下させるスパムが発生する可能性があるため、慎重さも求められます。Google は、このことを身をもって学びました。1999 年、Google の創業者は、Googleアルゴリズムの中心的な新技術、PageRank に関する重要な論文を発表しました。この論文が公開されると、スパマーたちは、リンクを売買し合うリンク プログラムで Google の検索結果を操作しようとしたのです。

この論文紹介まだブログに書いてないから今度書こう。


www.google.com

上記はアクセスを最大化するのページである。

法的な削除リクエストの場合はすべて、政府からの削除リクエストに関する情報を透明性レポートで公開しています。

透明性レポートに関しては知らないので学ぼう

Google は、ユーザーの安全を確保するとともに、Google のサービスを提供している約 200 か国の法律や文化的規範を尊重したいと考えています。

本筋とはそれるけど国数っていくつだっけって思って調べたら、外務省のページでは196カ国(国連加盟国数は193)と記載されていた。wikipediaにはより厳密な国数の数え方が定義されていた。


まとめ

  • How Search Worksは英語版で(たしか)読んだことがあったので大体は知っていた。でも今回のほうがきちんと理解したといえるだろう
  • 透明性レポートや削除ポリシーに関して詳しく知りたくなった
  • 具体的な数字が随所に書かれていたのが印象的だった。そのなかでも、2016年のテストの件数は15万件以上だったこと・検索クエリの 15% が初めてのものだということ・ナレッジグラフのデータベースにに500 億件を超える事実があること などは驚いた。
  • 動画がとてもおもしろかった

Google検索の「このサイトは第三者によってハッキングされている可能性があります」というメッセージについて

Google検索公式ヘルプページの 「このサイトは第三者によってハッキングされている可能性があります」というメッセージについて を読む。

support.google.com

Google検索をしてると検索結果のページURLとスニペットの間に
「このサイトは第三者によってハッキングされている可能性があります」
というメッセージが表示されることがある。このメッセージが表示されているサイトにアクセスすると、スパムや不正なソフトウェアにリダイレクトされる可能性がある。

ユーザーとしてこの現象に関して何か報告とか手伝えることがあるのかなと思ったのが今回調べた経緯だ。

「このサイトは第三者によってハッキングされている可能性があります」は見たこともある人もいるだろうが、例として以下の画像のようなかんじに表示される。(この検索結果は2017/11/20にスクリーンショットを撮ったものなので、日にちが経てば解決されるだろう。)

f:id:sakura818uuu:20171120085827p:plain

f:id:sakura818uuu:20171120085838p:plain

f:id:sakura818uuu:20171120085849p:plain

ウェブマスター(サイトの管理者)が自分の管理しているサイトでこのメッセージが表示された場合、Google Search Consoleを使って原因の問題を修正して再審査リクエストを行えばよいようだ。

ユーザーが発見した場合はGoogleは以下のような見解を述べている。

Google では、Google の検索結果にこのメッセージが表示されなくなるまで当該ウェブサイトにアクセスしないことをおすすめしています。

まとめとして「このサイトは第三者によってハッキングされている可能性があります」というメッセージが表示されているサイトに対してユーザーがGoogleに報告するフォームなどは特になく、行動としてはアクセスしないのが一番の選択だろうということだ。

Google検索のフィッシング攻撃への対策と報告を読む

Google検索の公式ヘルプのフィッシング攻撃への対策と報告を読む。

support.google.com

フィッシング攻撃に関する知識は昔学んだが、そういえばGoogleの検索結果でフィッシングサイトを見つけた時どうすりゃいいんだと思ってこの記事を読むことになった。

まず、フィッシング攻撃とはなにかを以下のように説明している。

フィッシング攻撃は、第三者がユーザーをだまして個人情報をオンラインで共有させようとするものです。

フィッシングのニュースは銀行や大手サイトに関するものをよく目にする。最近だとAppleやLINEのフィッシングに関するニュースがある。

www.security-next.com

www.security-next.com

以下の記事によると2016年にフィッシング対策協議会へ寄せられたフィッシングの報告件数は1万759件だそうだ。2008年から2016年のフィッシング件数のグラフも掲載されているが、年々徐々に増加傾向にあることがわかる。 www.security-next.com

話は少し戻ってGoogle検索でフィッシングサイトを見つけた時どうしたらいいかというと、Googleが設けているフィッシング詐欺の報告のフォームがあるのでそこに報告したらいいようだ。

f:id:sakura818uuu:20171120074810p:plain

加えて、フィッシング サイトについて政府機関に申し立てを行う方法に関してリンクが貼ってあったが、どうやらアメリカ向けのもののようだった。

また、Google検索の広告がフィッシングサイトだった場合はGoogle AdWordsの方に報告するほうが適切なことはわかった。しかし、貼られているリンクにいって色々クリックしてみたが、どこかにフィッシングという記載があるわけでもないので少しばかりわかりにくいかもしれない。

f:id:sakura818uuu:20171120082909p:plain

上記に加えて、フィッシング攻撃への対策と報告ページではGoogleに装っているページやロゴを見つけた場合にどうしたらいいかという方法も記載されている。
Googleを装ったサイトやメールアドレスを報告する場合はAvoid and report Google scams (英語)を読めばよい。
また、Google商標やロゴを不適切に使用しているサイトを報告する場合は公式の報告フォーム があるのでそこに報告すればよい。

f:id:sakura818uuu:20171120081227p:plain

英会話イベントに参加した

今日の19時-22時くらいまで英語のパーティーみたいなイベントに参加した

今日の成果

  • たくさんの人と英会話した(基本スマホとか動画で英語を学んでるので、リアルな人としゃべるの大切)
  • 苦手だった疑問文を自分から話せるようになった
  • リスニングがまだまだだってことを再度確認
  • 大きな声でしゃべるの案外重要

Google検索エンジン最適化スターターガイドを読む

Google検索エンジン最適化スターターガイドは、その名の通りGoogleが出しているSEO初心者が見るような情報がまとまっている30ページくらいのPDFである。

この記事ではGoogle検索エンジン最適化スターターガイドを読んで、感想や知らなかったことをメモする。私は1年前くらいに1回一通り読んだことがある。しかしあくまで読んだだけであってメモをしていないし、もう忘れてる所もあるので今回改めて読んでみる。そして今回はきちんと理解する。

今絶賛更新中との噂もあるが更新されたらまたその時に読めばいい。

SEOの基礎

  • ページタイトルはtitleタグで指定する
  • decriptionメタタグにページの概要を記述する。 Googleはdecriptionメタタグをスニペットに使用する可能性がある
  • 各ページに合わせてdecriptionメタタグをつけたほうが良い。自動で生成する方法もある

サイト構造の改善

  • 301リダイレクト 指定のURLへ自動的にジャンプさせる
  • サブドメインとルートディレクトリから同じコンテンツにアクセスしないようにする
  • サイト内のリンクで、www.のあるバージョンと、ないバージョンのURLを混在させない
  • URLの中で不必要に大文字を使わない
  • Google と相性の良いサイトを作成する方法
  • サイトのインデックス登録やランキングで有効なのは、"自然なリンクのみ"である。
  • テキストだけを表示するWebブラウザLynxというソフトウェアがある
  • パンくずリストとはページの上部か下部にある内部リンクを1列に並べたもの。ページの階層を知るのに便利
  • ユーザー向けサイトマップ(sitemap)と検索エンジン向けサイトマップ(Sitemap、別名XMLサイトマップ)を用意する。
  • XMLサイトマップは、どのバージョンのURLを標準としたいか(例えばwwwの有無のURL、どちらを標準にするか)をGoogleに伝える有効な手段の1つである
  • ナビゲーションをドロップダウンメニューや画像、アニメーションのみで作ることは控える。できればテキストリンクで
  • 404エラーページが検索エンジンにインデックスされないようにする
  • 404 ページのカスタマイズ
  • サイトのデザインにそった404 ページをつくる。
  • よりいい404ページをつくる。404やNot foundだけ書かれてもユーザーはわからない

コンテンツの最適化

  • 検索エンジンには見えるが、ユーザーには見えない隠しテキストと隠しリンク(例えば白の背景に白の文字を書くとか)を使わない
  • アンカーテキストとは、のアンカータグの間に挟まれているリンクが設定されたテキストのことを指す。アンカーテキストが適切だと検索エンジンやユーザーがリンク先の内容を理解しやすくなる。アンカーテキストは単語を数語か短いフレーズを使用する
  • 外部リンクはもちろん、内部リンクのアンカーテキストにも気を配る
  • 画像にはaltテキスト
  • 画像を保管するディレクトリは1つにまとめておくことで画像へのパスがわかりやすくなる
  • 見出しタグ(h1,h2,...,h6)を有効に使う
  • 強調emや強い強調strongの方が適切だと思われる箇所で見出しタグを使わない

クローラーへの対処

  • robots.txt検索エンジンクローラーにこのページはクロールしてほしいけど、こっちのページはクロールしてほしくないなを伝えるためのファイルである。robots.txtの詳細はrobots.txt ファイルについてのページを見ればよい
  • 検索結果にコンテンツを表示させない方法は他にも、“NOINDEX”をrobotsメタタグに追加、.htaccessを使ってディレクトリにパス ワードを設定、Googleウェブマスターツールを使ってすでにクロールされたコンテンツを削除するなどがある
  • 機密事項や慎重に扱うべきコンテンツがクロールされないようにするには、robots.txtの設置だけ でなくコンテンツの暗号化や.htaccessを使ってパスワードをかけて保護する
  • 検索結果のようなページはクロールさせない
  • プロキシサービスによって生成されたURLはクロールさせないようにする
  • コメントスパムへの対策としてアンカータグの中にrel=nofollowを記載する。特定のリンクに対して rel="nofollow" を使用するnofollowの詳細が書かれている

モバイルSEO

  • モバイルサイトマップ(モバイル用のXMLサイトマップ)の存在。通常のサイトマップと同様に、ウェブマスターツールを使って送信できる。詳細はサイトマップを作成、送信するを参照
  • ユーザーエージェント(UA)...ユーザーがウェブサイトへのアクセスの際に使用するソフトウェアまたはハードウェアのこと
  • モバイルサイトがインデックスされるようにする際の注意点→“Googlebot-Mobile”という文字列を含むUAからのアクセスも許可するようにする・Googlebot-Mobileで使用するIPアドレス帯域からのアクセスを許可する・モバイル フレンドリー ページを開発するためのリソース
  • デスクトップからの検索に対してはデスクトップ版のURLを、モバイル検索にはモバイル版のURLを出すようリダイレクトを上手く使って実現する
  • UAによって表示を切り替える方法もある。しかし、れはクローラーに返すコンテンツの設定を誤ると場合によってはサイトの偽 装、いわゆる「クローキング」と見なされることがあるので注意

プロモーションと分析

まとめ

  • htmlのタグに関して忘れてたことが結構あったので今回ちゃんと覚えることができてよかった
  • 確かに全体的に内容が弱冠古いと感じた(例えばモバイルフレンドリーやGoogle Search Consoleなどの言葉がでてこない)
  • モバイルとデスクトップでどう情報を表示するかやUAの部分がちょっとややこしかった
  • robots.txtに関しては別途正確に覚える必要がある
  • 404のカスタマイズ興味深かった
  • ウェブマスターに関する情報、自分が今まで考えてたものより面白いものかもしれない

ウェブマスターアカデミーを受講する

support.google.com

ウェブマスターアカデミーとはGoogleのSearch Consoleヘルプに掲載されている、1時間ほどで受講できるウェブマスターのための学習ツールの1つである。今回実際に受講してみた。

ウェブマスターアカデミーでは具体的に以下のようなことを学ぶ。

  • Google 検索の仕組み
  • Google Search Console の仕組み
  • サイト作成の方法

3章構成となっており、各章の終わりに簡単なクイズも設けられている。

以下では特に気になったページや個人的にメモしておきたいページをコメントを添えながら書いていく。


support.google.com

コンテンツを作成するときの5つのポイントについて書かれていた。当たり前のことで、それはそう、と思うことだけど抽象的なことを的確に言い表していると思う。

  • 有益で情報が豊富
  • 他のサイトより価値が高くて役立つ
  • 信頼性がある
  • 高品質
  • ユーザーを引き付ける

Wikipediaも記事作成についていくつか言及しているページがあるけど、それにも通ずることがあった。

Wikipedia:素晴らしい記事を書くには - Wikipedia


www.youtube.com

あなたのサイトがGoogleに見つかるには?をテーマにした動画である。robots.txtや再審査リクエストなどに触れられている。
Google Search Quality Team の方が紹介していた。


support.google.com

わかりたすいタイトルの付け方、metaタグ、altタグについてわかりやすく簡潔に説明されている。


support.google.com

正当な SEO は「ホワイトハット」、不適切で不正な手法は「ブラックハット」と呼ばれています。ブラックハット SEO はオーガニック検索結果での掲載順位を上げるどころか、実際にはサイトやその評判を傷つけるため、2 つの手法を区別することが重要です。

ホワイトハットはユーザーを重点に置いた考え方で、ブラックハットは検索エンジンを騙してサイトの掲載順位を引き上げようとするとする考え方である。


support.google.com

コメントスパムの対策はコメントをメタタグでno followにする。


まとめ

  • ウェブマスターの基礎の基礎を知れる
  • すごく初歩的なものかと思っていたが、案外専門用語が結構使われていた
  • 動画やクイズがあるのでわかりやすかった
  • でも1時間で学習できるものなので、弱冠薄いかもしれない。もっと色々知りたくなった。
  • 特にSearch Consoleに関して興味が湧いた