CloudSearch

Сегодня Амазон объявил о выходе нового продукта - поисковик в облаке. То есть все то, о чем можно мечтать при обработке больших объемов данных. Есть интерфейс стоп слов , управление полями индексирования и т.п. Пугает лишь то, что за это придется платить и так как сервис новый, то стоит ожидать крупных сбоев. По цене все предлагается за от $0.12 per hour, что есть 1 инстанс и меньше 100у.е. в месяц. На базе cloudsearch уже проиндексировали Википедию, правда только англоязычную. Русский язык там не работает. В любом случае это мощная заявка на то, чтобы подвинуть другие корпоративные решения по контекстному поиску, который в перспективе станет мощнее яндексовского.

Что касается Azure, то для него пока нет решения из коробки в виде отдельного поискового сервиса, однако есть библиотека Lucene, которая позволяет индексировать и искать документы в облаке, хранить индекс будет в storageblob, но настраивать придется все самому. Но и тут нет морфологии. Если бы морфология поставлялась из коробки, а не приходилось бы прикручивать Lemmatizer, то это решение бы победило.

Метки: , , , , ,   


blog comments powered by Disqus

Добавить комментарий

Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner

Реклама

 

копирайт

Все мысли, высказанные в блоге, являются моим мнением и за это мнение меня никто не забанит! Кроме того, никто не имеет право копировать материалы блога без использования ctrl+C/V!

© Copyright 2008