Анонс мероприятия Яндекса

Стало известно о готовящемся мероприятии Яндекса(Я.Субботник), где самое важное на мой взгляд
  1. расскажут про Спеллер - веб-сервис Яндекса, предоставляющий API для проверки правописания на сайте
  2. Антон Волнухин и Роман Иванов(kukutz) поделятся информацией, как устроен поиск по блогам, как работают рейтинги блогосферы (ТОП30???) и как самостоятельно использовать API поиска по блогам.
ЗЫ: надо больше не лажать и не приходить в футболке от гугла. Хех, футболок от гугла полно, а вот от яндекса ниодной.

Метки:   Категории:topbot | news | YandexUtility


YandexUtility 2009 reviewed

С наступлением нового года устарела лицензия на написанной мною 2 года назад программе YandexUtility, поэтому я обновил программу.
Что это? Это программа, написанная на Csharp, для анализа блогосферы на основе данных, получаемых из яндекса.
Что изменено? Исправлено большинство регулярных выражений, которые успели устареть, а также обновлена лицензия на морфологический анализатор до конца года.
Что делает? Позволяет отслеживать рейтинги виртуалов; читать ТОП; читать баш =); анализировать частотное упоминание слов в конкретной ленте, в комментариях к ней и в заданной теме дня; анализировать упоминание слов в темах, на которые выбранный блогер чаще всего пишет комментарии; убирать некоторые известные банеры(реклама в жж) путем автоматического редактирования hosts; делать вставки в блог с результатами анализа;
Есть ли руководство пользователя? Нет. Но внутри программы есть некоторые комментарии. Умные люди должны разобраться.
Установщик последней версии можно взять тут - YandexUtility1.1beta_setup.exe
Пример некоторой аналитики, с использованием программы, под катом:
Для начала я посмотрел упоминания слов в постах Самизнаетекого за текущий год, то есть за последние 10 дней:
Top30 самых используемых слов в ленте tema.livejournal.com/data/rss

БЫТЬ:8 ЕСТЬ:7 СМОТРЕТЬ:6 TEMALEBEDEV@GMAIL.COM:6 ХОРОШИЙ:5 СДЕЛАТЬ:5 ДЕЛАТЬ:5 БЛЯТЬ:4 ОДИН:4 РАННИЙ:4 РАБОТАТЬ:4 WWW:4 ПИЗДЕЦ:4 НАПИСАТЬ:4 УЗКИЙ:4 СТАТЬ:3 СОВЕРШЕННЫЙ:3 ПРИСЛАТЬ:3 ЗАПОМНИТЬ:3 ЧИТАТЬ:3 МОЧЬ:3 ПИСАТЬ:3 ПЕРЕТЬ:3 ПЕРВЫЙ:3 НАЧАТЬ:3 СЛУШАТЬ:2 ЛЮБИТЬ:2 ИНТЕРЕСНЫЙ:2 ПРИЕЗЖАТЬ:2 ЗНАТЬ:2

Всего обработано 26 постов, найдено 846 слов из них уникально 602
Длина поста(слов): 5(Минимальная),1015(Максимальная),115,5769(Средняя)
(c) flashr и его программа YandexUtility

Потом хотел было проанализировать комментарии в его жжурнале, но, как оказалось, Яндекс забил на комментарии оставляемые в журнале Темы. А Единственная запись, на которую отреагировал согласно Яндексу СамВеликий содержала следующие слова: Оптимус, говноджип, Дэнги. Но так как запись всего одна то и анализировать нечего.

И в завершение разбор слов в теме про газовый конфликт:
Top30 самых используемых слов в ленте 'Газовый конфликт с Украиной'

БЫТЬ:106 ГАЗОВЫЙ:103 МОЧЬ:86 УЗКИЙ:69 ХОТЕТЬ:66 ЕСТЬ:62 СКАЗАТЬ:45 ГОВОРИТЬ:42 ЗНАТЬ:41 ДОЛЖНЫЙ:39 ЮЩЕНКО:37 КОНЕЧНЫЙ:37 ДЕТЬ:36 ПОНИМАТЬ:35 ИДТИ:34 СЧИТАТЬ:33 ИМЕТЬ:33 ОДИН:33 СДЕЛАТЬ:32 ЯВЛЯТЬСЯ:32 ДЕЛАТЬ:32 ДУМАТЬ:31 РОССИЙСКИЙ:31 МНОГО:30 СТАТЬ:30 РОСУКРЭНЕРГО:30 ЭТОТ:29 ВИДЕТЬ:29 ПЛАТИТЬ:28 СВОЙ:28

Всего обработано 200 постов, найдено 14423 слов из них уникально 4793
Длина поста(слов): 6(Минимальная),2588(Максимальная),294,52(Средняя)
(c) flashr и его программа YandexUtility

Метки:   Категории:Code | YandexUtility


Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner