自作自演

Firefox の話題を中心に Web 関係の話も扱うつもりの雑記。だった。
zisakuzien.exblog.jp

Top

よくわかるAmazon #CloudSearch に行ってきた。

5月15日 AWSプロダクトシリーズ|よくわかるAmazon CloudSearch(東京都)

少し CloudSearch を触ったことがある、という状態で行ってみました。
英語の話はわからないのでは…と不安でしたが、逐次日本語訳を付けて頂けたので何とかついていけました。
以下、自分の興味のあったところなど。

■CloudSearch Technical Deep Dive

インデックス作成時は下記の流れで文章を処理しているとのこと。
・トークナイズ (日本語なら形態素解析)
・ノーマライズ
  ・英語なら小文字に寄せる
  ・日本語だと半角カナを全角カナに寄せる。ただし「ヴ」の扱いなどまだ微妙なものも。
・ステミング (活用している語を自立語にするなど)
・stop word を取り除く (冠詞を除く? 日本語なら助詞を除くなど)
・シノニムを加える
  ・シノニムには1方向の alias と双方向?の group がある。

今はできないこと (将来の課題?)
・N-gram
・形態素解析辞書のカスタマイズ

Impression of using CloudSearch

・ドキュメントの追加・削除はなるべくまとめてしないとお金がかかる。
・頼めばインスタンスとパーティションを増やしてもらうことはできるが、ウォームアップはできない。
・VPC のセキュリティグループ使えない。

■感想というか、今後の希望。

・グルーピングの機能がほしいのでお願いします!!!
 例えば、色・サイズごとに在庫数があって、グルーピングしつつ在庫のあるものだけをひっかける、とかしたいです!

・ウォームアップもほしいです。発売日とかセールとか、アクセスが跳ね上がるケースってあると思うので…

・N-gram と辞書のカスタマイズも…

・ちょっとデータ入れて検索を試してみる、というところまではシンプルなので
 グルーピングや精度にうるさい全文検索が不要なら使えるのでは、と思いました。
 アクセス数が特に跳ね上がらなければ普通にオートスケールもあるとのことですし。

・話にもあまり上がらなかったし、自分でも試せていないのですが、
 latlon の検索がどんな感じなのか、気になります…
[PR]
by tokage-shippo | 2014-05-16 12:27 | プログラミング
Mozilla Firefox ブラウザ無料ダウンロード

about this...

書き手の名前は 晴柳祐志 と言います。


リンク

Twitter
いつか何とかしたいサイト

最新のトラックバック

[foxkeh]フォクす..
from 「 Firefox ×?=!..
[Firefox]Fir..
from +Sun Flower〜報告〜+
Firefoxバトン
from MなMによるMのための日記
スキン変更!
from SUKA・SUKA・BLOG
Firefox 1.5に..
from mmkg

検索

S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
XML | ATOM

個人情報保護
情報取得について
免責事項