2017年下半期の旅行まとめ

sakura818uuu.hatenadiary.com

この日は天気が本当にすごくよくてとても楽しかった。ハナヤマタOPの荏柄天神社がすっごくよかった。

sakura818uuu.hatenadiary.com

荻窪の大田黒公園がよかった。今まででいちばんの鯉。

sakura818uuu.hatenadiary.com

ブログには書いてないけど夏目漱石の話がすごく残ってる。

sakura818uuu.hatenadiary.com

久々に高校の学園祭に行った。あと町内会のお祭りのかき氷とか焼きそばはおいしいな〜

sakura818uuu.hatenadiary.com

稲の田奈、田舎だった

sakura818uuu.hatenadiary.com

お好み焼きめちゃくちゃおいしかった。イカスミ焼きそばも初めて食べたけどおいしかったな〜

sakura818uuu.hatenadiary.com

上野動物園は人が多かった。根津神社は想像より大きかった

sakura818uuu.hatenadiary.com

なんといっても耳をすませば聖蹟桜ヶ丘がよかった。高尾山も登山した🗻

sakura818uuu.hatenadiary.com

晴れててぽかぽかしてて三崎口のんびりしてた。この日は一日中旅行したな…

sakura818uuu.hatenadiary.com

定番の藤沢の海鮮丼屋さんで食べて、鎌倉文学館の雨明けのバラがとてもきれいで、おでん屋さんでおいしいおでん食べて、とても充実した旅行だった

sakura818uuu.hatenadiary.com

上総亀山の西洋風景画みたいな風景を見れた。内房線外房線・総武線・久留里線小湊鉄道いすみ鉄道銚子電鉄いろんな電車にのって、最後は犬吠埼の温泉にはいった。温泉いい

sakura818uuu.hatenadiary.com

アンテナショップもいいけど、いつかはアンテナショップで訪れた都道府県に直接いって旅行したいな〜

第14回Elasticsearch勉強会の資料を読んだメモ

Elasticsearch勉強会(Elastic Tokyo User Group)資料を第1回から順番に資料を読んでいく。今回は2016年1月7日に開催された第14回の資料を読む。


ココが辛いよelasticsearch

www.slideshare.net

読んだ感想

  • Snapshot API/Restore APIで実際の検索結果をもとに検索結果を改善する用のクラスタを複製?
  • 1系から2系のバージョンアップの時にどのように対応するか→2バージョンのクラスタを用意してリアルタイムで移⾏
  • Elastic社にきいた簡単なバージョンアップ法→reIndexが終わった段階でSearch⽤のLBを切り替えればいい
  • Facebook上に「検索索技術研究会」というのがあるらしい…!

機械学習を利用したちょっとリッチな検索

www.slideshare.net

読んだ感想

  • テーマ 検索対象の情報を機械学習によって増やす・検索エンジンの集計機能を活かして検索をリッチにする。  検索エンジンはそのままでOK! –  検索エンジンの外側で機械学習を適⽤し、結果を利用する。つまりデータをElasticsearchに入れる前に機械学習を適用し、データをリッチにする。
  • 機械学習とは何か、使うための必要な5ステップなどわかりやすい説明
  • 実際に機械学習を Elasticsearchと連携するには
    • 選択肢1: オフラインで RやPythonなど好きなものを使って機械学習を適⽤してから情報が増えたデータをElasticsearchに投⼊
    • 選択肢2: fluentdのexec filterからオンライン機械学習向け分散処理フレームワーク — Jubatusを叩いてオンラインで適⽤する
    • 選択肢3: PFNが公開するOSSを利用する(Chainerもサポート、OSSの名前なんていうなんだろう)

Lucene Query 再考 - Domain Specific Query 実装 -

www.slideshare.net

読んだ感想

  • Lucene Query API
  • 近接検索系のクエリ

Fluentd meets Beats

www.slideshare.net

読んだ感想

  • fluent-plugin-beats Input plugin for Elastic Beats
  • firebeatは(Beatsの一つ)は遅いから代わりにfluent-agent-hydraを使うといい
  • fluent-plugin-beatsの利点はなんなんだろう…beatsかませなくてもfluentdからそのままelasticsearchにログ渡せばいいのでは.と思ってしまった

Elasticsearchインデクシングのパフォーマンスを測ってみた

www.slideshare.net

読んだ感想

  • 複数セッションでデータを送信するとスループット向上だが、32セッション以上でデータ欠損の可能性あり
  • ノード内のシャード数が多い(プライマリシャード数9〜)とオーバーヘッドが増加する
  • 適切なbulkのサイズはMax(100MB)未満で1MBとか小さすぎなければOK
  • index設計時にallやsource削減でスループット向上