第13回Elasticsearch勉強会の資料を読んだメモ
Elasticsearch勉強会(Elastic Tokyo User Group)の資料を第1回から順番に資料を読んでいく。今回は第13回の資料を読む。
- Beyond the basics with Elasticsearch
- How did we use Found.no for our services?
- ログ収集の仕組みを再考しよう! あとマウンテンビューに行ってきました。
- Elasticsearch を使った単語共起頻度の計算
Beyond the basics with Elasticsearch
読んだ感想
- 全編英語のスライド
- 集計とか分類とかの説明。
- Percolator(パーコレーター)っていうクエリを探す機能についての説明もあった。(Percolatorの詳細はElasticsearch パーコレータ – Hello! Elasticsearch. – Medium)
- 正直良くわからなかった
How did we use Found.no for our services?
資料なし
ログ収集の仕組みを再考しよう! あとマウンテンビューに行ってきました。
Let's reconsider about collecting logs. Plus, visiting elastic@Moutai…
読んだ感想
- 全編英語のスライド
- 様々なログについての説明
- 英語のスライド苦手ということに気づいた
Elasticsearch を使った単語共起頻度の計算
Elasticsearch での類似文書検索と More Like This Query API 詳解 // Speaker Deck
読んだ感想
- bingのbitfunnelの記事書いたTakuya Asanoさんの記事
- More Like This Query APIは類似文書検索ができる
- 同じ語を含む文書を類似文書と定義する。しかし、文書に含まれる全ての単語で計算するのは現実的ではないのでいくつか重要語を選択する。その重要語をどのように選ぶかが大切。
- More Like This Query APIのアルゴリズムの説明
- Term Vectors APIも類似文書検索ができる
- More Like This Query APIは簡単に使え、Term Vectors APIはより柔軟なクエリ拡張ができるという長所がある
- スライドがめちゃくちゃわかりやすい