第16回Elasticsearch勉強会の資料を読んだメモ
Elasticsearch勉強会(Elastic Tokyo User Group)の資料を第1回から順番に資料を読んでいく。今回は2016年6月27日に開催された第16回の資料を読む。
- LogstashとElasticsearchで作るEnterprise Search Platform
- 企業・業界情報プラットフォームSPEEDAにおけるElasticsearchの活用
- Elasticsearchベースの全文検索システムFess
- GCPのネットワークでハマった話
- スクリプトフィールドで作るランキングみたいな何か
LogstashとElasticsearchで作るEnterprise Search Platform
読んだ感想
- Samba?の話
- スライドがきれい
- Logstashの機能の説明
企業・業界情報プラットフォームSPEEDAにおけるElasticsearchの活用
www.slideshare.net
読んだ感想
- Elasticsearchを導入した経緯はいままでMySQLでやってたけど速度に限界が出てきて、たまたまElasticsearch勉強会に参加した時に不動産検索の話があってそれが自社のやりたい検索と似ててこれ(Elasticsearch)なら今抱えてる悩みを解決できそうと思ったから
- SPEEDAで行う企業名検索はWeb検索とは検索の特徴が違う Web検索ではトークン分割を形態素にして精度(precision)重視だけど企業名検索はトークン分割をngramにして再現率(recall)重視
- Elasticsearch 1系を使用している
- phrase_prefixによる検索処理の流れ
- max_expansionsは検索文字列に先頭一致するtermを何個まで検索するか制御するパラメータ
- ノード構成の見直しによりデータノードの負担が軽減され、更新処理、検索処理の性能を大幅に改善 具体的には改善前は検索応答速度0.5秒以上なのが7.2%あったのが改善後は2.7%になった
Elasticsearchベースの全文検索システムFess
www.slideshare.net
読んだ感想
- Fessはbi-gramと形態素解析のハイブリット検索
- Fessの今後→より大規模検索へ (対象容量が数十TBへ) ・Deep Learningを用いた検索 (画像とか)
GCPのネットワークでハマった話
読んだ感想
- Elasticsearch 2.3.1, CentOS 7.2使用
- 2時間間隔でマスターノードとのpingに失敗する
- 原因解決するまでの試行錯誤が書いてある
- GCPのファイアーウォールはinactiveコネクションは10分で切断するので、Elasticsearchのnet.ipv4.tcp_keepalive_timeの設定を60秒にしたら解決した
スクリプトフィールドで作るランキングみたいな何か
資料が見つからなかった
第15回Elasticsearch勉強会の資料を読んだメモ
Elasticsearch勉強会(Elastic Tokyo User Group)の資料を第1回から順番に資料を読んでいく。今回は2016年3月16日に開催された第15回の資料を読む。
- Elasticsearchと機械学習を実際に連携させる
- Elastic{on} 2016 参加レポート
- Elastic{ON}の過ごし方
- Elastic{ON} 2016 見るべきセッション資料 7選
Elasticsearchと機械学習を実際に連携させる
www.slideshare.net
読んだ感想
- 第14回の機械学習を利用したちょっとリッチな検索の続き
- 今回のテーマは実際にどうやって機械学習を適⽤すれば良いのか。PFNが2016/3/14にリリースしたOSS(SensorBee)を使って実演
- SensorBeeは(特に)ネットワークのエッジ/フォグでストリームデータに対して機械学習(特にDeep Learning)を利用した非構造化データ向けのETLを低レイテンシで適用することを目的としたツール(よくわからない…)
- 実演 英語のツイートに対して年年齢と性別のラベルを振る
- Twitter→SensorBee(機械学習)→Fluentd→Elasticsearch
- 機械学習のステップ3. 教師データを作る のアノテーション(正解を付ける作業)は苦⾏らしいけど頑張る
- SensorBeeを使うとストリームデータに機械学習を適⽤でき、そしてfluentdを使うことでその結果をElasticsearchやデータベースに⼊れられる
Elastic{on} 2016 参加レポート
読んだ感想
- elastic{on} 2016はサンフランシスコで開催 参加人数は1800人以上
- ランチミーティングのことをBBL(Brown Bag Lunch)っていうらしい
Elastic{ON}の過ごし方
elasticsearch-15-lt from 真司 藤本
www.slideshare.net
読んだ感想
- Elastic{ON}2016で面白かったこと紹介
- AMA(Ask Me Anythingの略) Elastic社エンジニアとフリートーク
Elastic{ON} 2016 見るべきセッション資料 7選
読んだ感想
- Elastic{ON} 2016でElastic stack使ってる人が見るべきだと思われるスライド7個紹介