LiveJournal's Quote

Идя на поводу у популярных блогеров Живой Журнал в последнем обновлении нежданно-негаданно сделал функцию цитирования записи. Напомню, что последнее время появилась мода добавлять в посты на ЖЖ кнопки по цитированию поста, копируя функционал ЛиРу. Но(!) в отличии от того же ЛиРу, где возможность цитирования записи существовала издревна, ЖЖ в качестве цитирования создал аналог "одной кнопки" по добавлению записи во все места. По нажатию кнопки цитирования вываливается куча возможностей, которая испугает любого действенного пользователя и он больше не станет нажимать на эту кнопку. Зачем пользователю все эти неизвестные сервисы показанные на картинке??? Достаточно твиттера, жж и фейсбука, как во всех популярных блогах. Ну кто, скажите мне, пользуется всеми этими сервисами социальных закладок, кроме сеошников поднимающий PR сайту??? Неужели ЖЖ всетаки загинается, как это нам говорит статистика и новый кривой функционал =(.

ЗЫ: примечательно, что у всяких там вконтактах функционала цитирования до сих пор нет.

Метки:   Категории:Blogs | Livejournal


House e06s15

Посмотрел на днях 15ю (последнюю из вышедших пока) серию любимого сериала House M.D.. Примечательно, что серия посвящена лечению популярного блогера. Один из прозвучавших диагнозов - "Вы не можете самостоятельно принимать решения, Вам постоянно нужно советоваться со своими читателями, вы не можете поступать так, чтобы не разочаровать своих читателей". И логика в этих словах есть. Когда ты популярен, ты постоянно думаешь о том, чтобы сделать, чтобы это сохранило твою популярность. Но если мы возьмем по настоящему популярных блогеров, то я не знаю примеров, чтобы то, что им пишут в комментариях как-то влияло на принимаемые ими решения. Да, они часто задают вопросы и проводят опросы. Но это лишь потому, что вставка вопроса в пост увеличивает число комментариев и следовательно популярности. Блогеры, для которых мнение их читателей что-то значит, определенно существуют и занимают низшие позиции в рейтингах. Вот они-то пожалуй и больны. Но лечить их не стоит, так как они и являются целевой аудиторией для рекламодателей, а рекламодатели - это прежде всего деньги для развития блогосферки.

Обобщить сделанный вывод можно на экспертные системы и тех, кто ими пользуется. Хорошим примером будут аналитики и игроки на бирже. Не понятно, толи аналитики делают прогнозы после действий игроков, то ли игроки делают действия исходя из прогнозов. Но все знают, что есть игрок центробанк, к действиям которого прислушаются все игроки. И следовательно [по первому правилу программиста], существуют и другие игроки, которые не прислушиваются к прогнозам и играют не меньшую роль на рынке чем центробанк.

Также это опровергает концепцию электронного правительства, когда все политики ведут блоги и советуются в них с народом о принятии решений. Политики могут и должны вести блоги, но только для получения канала обратной связи, который прежде всего нужен народу, а политики могут на него даже не обращать внимания.

Метки:   Категории:Blogs


icom - part 2

На вчерашней конференции I-community2010.ru читал доклад. Презентацию Доклада с моими же комментариями можно скачать и почитать. Тема: "Концепция единого программного интерфейса по взаимодействию с русскоязычными блог-платформами" была призвана рассказать всем, что на проблему программного взаимодействия сервисов в интернете по разному смотрят сами создатели соц.сети, пользователи и разработчики. Также я предлагаю объединить усилия разработчиков над открытым кодом, чтобы упростить друг другу жизнь и заставить создателей соц.сетей делать нормальные интерфейсы для базового функционала, который я описал.
К сожалению, глубину моей мысли оценили не многие, зато мой доклад сильно отличался от других "представителей компаний", которые пришли на конференцию только ради рекламы себя и своих продуктов. Особо вставляла центральная секция, где у докладчиков не было докладов и все время на экране крутилась реклама партнеров.

Из всего обсуждения про твиттер можно было вынести реплики #ded 'ka, который от лица всех слушателей задавал ведущим каверзные вопросы, в то время как остальным было лень пытаться сказать ведущим, что то, что они рассказывают уже не интересно и было озвучено ранее. Из полезного, это замечание, что число занесения в листы на твиттере более говорит о читаемости человека нежели его количество френдов. Да, это сейчас так, и норма в среднем 600 занесений в листы на 10 тыс. последователей. Но и это число при желании можно легко накрутить, поэтому очевидно, что самый главный показатель - число переходов со ссылки.

В заключение, на секции про правовые вопросы, было отмечено, что по российскому законодательству за сайт несет ответственность тот, кто хостит сайт, то есть каждый, кто ведет блог на стандалоне, обязан модерировать свои комментарии, иначе его и автора комментария вполне могут привлечь за какую-нить ерунду типа разжигание. Смешной прозвучала мысль устроить в рунете монархию по принципу, что весь контент принадлежит по умолчанию президенту, а он может делегировать права на него разным людям.

Метки:   Категории:Blogs | Code


top fail

В начале этой недели многие могли наблюдать нарушения в работе топа. Визуально - в топ попадала всякая ерунда. В частности, я выделил 2 провала, которые, можно сказать, "epic fail" для текущего алгоритма:

1) В топ попал пост с фоткой женских генеталий. Не смотря на то, что пост не являлся спамерским, а содержал вполне осмысленный текст и читатели его действительно обсуждали, можно сказать, что это была первая "пизда, пришедшая топу".
2) Вторая ошибка заключалась в том, что 2 почти идентичных поста, с одинаковыми фотками и разницей лишь в 10% и одной ссылкой - попали в топ и висели друг за другом. Одно лишь утешение, что попали по времени не подряд.

Объяснения этим проблемам простое. Я все еще пытаюсь играться с "ожидаемым" количеством записей, которые должны прокручиваться через ТОП в течении суток. Меня все еще настораживает популярность, которая есть у всяких там топ100 и топ50, по сравнению с моим топ30, и которая вызвана лишь тем, что в те топы попадает почти все. Кроме того эксперименты подтвердили, что чем больше записей в день проходит через топ, тем больше людей его читает. К сожалению, людям все равно что читать, так как многие приходят через поисковики.
В итоге, в ближайшее время хочу программно гарантировать, чтобы в топ в дневное время суток попадало больше постов, нежели ночью, ибо записи нужно писать тогда, когда люди их готовы читать, а читают больше днем.

------
И в завершение поста, я завтра выступаю на Icommunity2010, видимо я буду единственным, кто идет рекламировать не свои продукты, а свое хобби. Более того, большинство посетителей конференции наверняка придут ради твиттер секции, чтобы посмотреть на "местных клоунов", не скрою, что и я с удовольствием послушаю то, что там будет происходить.

Метки:   Категории:Blogs | Twitter | topbot


Advertising in blogs

Небольшая заметка о том, как определить платный пост в блогосфере. Точнее перечисление некоторых основных признаков, которые есть у поста, размещая который автор имеет своей целью разрекламировать товар или услугу.

  • Самое очевидное, когда автор сам помечает пост, как несущий рекламное содержание. Но уже бывали случаи, когда автор просто хочет сделать вид, что причастен к рекламной кампании или подурачить читателей.
  • Далее, почти во всех рекламных постах слово блогер пишется неправильно с двумя Г. Это обусловлено тем, что изначально SMO пошло с запада и крупные пиарщики и SEOшники в блогах привыкли к написанию точной кальки с английского языка. Некоторых я пытался вразумить, но они не хотят меняться и продолжают публиковать рекламные тексты только с двумя Г. Даже известная компания на Б, в названии которой содержится всего одна Г, не устояла под их давлением и сегодня рекламирует написание с двумя Г.
  • Объявления о халяве. Например, билеты на концерт тем, кто поставит ссылку. Билеты получают единицы, а ссылки ставят десятки блогеров. Тут же стоит обратить внимание на упоминание в посте таких терминов как "случайно выиграл", "неожиданно пригласили", "много призов", "было много людей".
  • Публикация трейлера или баннера, выходящего фильма. Исторически сложилось, что в блогах рекламируется очень много фильмов, однако, ни один блогер, чья работа целиком не завязана на кино, не станет публиковать полную вставку видео через тэг object или выискивать картинку с описанием фильма. Во-первых, это сложно и долго, проще поставить ссылку на понравившийся ролик, а во-вторых проще написать текстовый отзыв, если фильм уже просмотрен и понравился, а заинтересованные сами найдут тизер в интернете или уже пиратскую версию всего фильма в торрентах.
  • Публикация предложения поучаствовать в проводимом конкурсе со ссылкой. Часто конкурс проходит в одном дневнике, а покупаются упоминания о нем в других блогах. Реальный человек, учавствующий в конкурсе, не станет предлагать вам поучавствовать, ибо в этом случае Вы будете его конкурентами. Нормальный блогер попросит либо за него проголосовать, либо промолчит.
  • Простая публикация ссылки на внешний ресурс первого уровня (типа, example.org), который не является блогом. Обычно материал, который заинтересовал блогера лежит глубоко в дебрях сайта и ссылка ведет на внутреннюю страницу, а не на главную, например, example.org/2010/03/best-porno.aspx?id=666&utm_souce= , так как блогер копирует ее напрямую из своего браузера.
  • Рекламное сообщение публикуется обычно утром, либо днем. Так как наибольшая активной блоговых читателей приходится на начало дня и на конец рабочего дня. Иногда рекламный пост может нарушать привычную частоту публикаций для блогера, та как заказчик пришел и сказал разместить материал и ему всеравно, что привычная норма для блогера состоит в одном посте в день, а не в двух. Либо блогер давно не писал, а тут кто-то вспомнил, что у него есть замечательный аккаунт, который можно включить в отчет - так рождается еще один рекламный пост.

На этом списке я пока остановлюсь. Еще очень много рекламируется книжек самими авторами и косметики в явном виде, но тут Вы думаю, сами не заинтересованы в покупке всякой ерунды.

Метки:   Категории:Blogs | Analytics


Околонаучные новости.

Сегодняшним постом выскажусь о трех недавних работах, которые можно считать попытками сделать в блогосферке, да и в интернете, что-то научное.
Во-первых, это новость про алгоритм определения влиятельных блогеров для наилучшего распространения информации, его даже на ленту перепечатывали. Удивительно, но реализации у этой методики нет, так как для этого алгоритма потребуется знать все ребра и вершины социального графа в конечный момент времени, а это уже есть утопия. Также почти все социальные сети не позволят Вам беспрепятственно извлекать информацию о связях (ребрах) социального графа. Авторы гордятся доказательством того, что блогеры с большим числом друзей, не всегда самые влиятельные. Но на практике, когда ретрансляция рекламного поста быстро затухает рекламодатель прежде всего заинтересован в размещении рекламы у тех блогеров, аудитория которых не пересекается и максимальна. То есть просто сортируются все блогеры по стоимости контакта и ищутся те, кто согласится размещать материал. Мой вывод, что алгоритм ранжирования на яндексе (за исключением ранжирования твиттера, ибо каждый ответ приравнивать к ссылке - это идиотизм) куда более жизненный и демонстрирует кластерную обработку поступающей информации, нежели предложенный в работе.

Вторая работа является кандидатской РАН на точно такую же тему - определение точек вброса информации в социальную сеть. Правда в отличии от первой работы автор не ограничивает себя во времени и строит сети Маркова на N мерном графе, которые могут сходиться к заданному значению бесконечно долго. Работа опять страдает вышеперечисленным, что считается известным все и вся в графе. Абсурд дополняется тем, что считается, что точки вброса информации со временем могут менять транслируемое мнение и то, что все участники сети с одинаковой степенью впитывают чужеродную информацию и к любому участнику сети мы можем приложить управляющий вектор. Пользы от такого тоже мало.

И в заключение, новость о запуске HotLog'om статистику статистик по сайтам рунета, по аналогии с той, что уже два года работает у меня на ljmap.info и обрабатывает больше источников включая зарубежные. По опыту, отмечу удобство нахождения данных по произвольному сайту, для которого хочется найти данные, но заработать на этом невозможно. Если брать научную составляющую, то подобный сервис является из разряда 8го инварианта семантического интернета - Monitoring, то есть сбор воедино распределенных статистик(5х инвариантов - Combine). Прозрачность получения данных и общедоступность таких ресурсов позволяет говорить об их полезности для интернета в целом.

Метки:   Категории:Blogs | Semantic Web


два антона и про топ30

На россия.ру появилось видео, которое я бы озаглавил грубо: "Два Антона и те, кто дрочил на топ, но не смог создать свой". Вся передача в основном является повторением уже сказанных мыслей про топ яндекса и рекламой понятно какого ресурса, иначе бы Носик не сидел.

Добавлю свои комментарии.
Во-первых, почитайте историю топа глазами топбота в РусскомПионере, которую я написал - http://www.ruspioner.ru/ru.php?id_art=1045 . Во вторых, ТОП появился прежде всего из аналитики. Когда у людей нет времени читать все - они хотят читать самое главное. Они хотят это читать регулярно и особо не затрачивая усилия на нажатие дополнительных кнопок. Если топ не обновляется - ты чувствуешь, что теряется что-то. Если в топе слишком много вариантов и настроек - то нет желания пытаться настраивать. Топ должен быть таким, чтобы в любой момент, хоть посреди ночи, ты мог войти в интернет и увидеть все темы, которые актуальны для обсуждения, чтобы моментально стать "вкурсе событий". Поэтому тематическое нормирование делается таким, чтобы максимально охватить все тематические максимумы, даже если это рекламный пост математически попадает в топ - то он должен быть в топе, чтобы ты соседу сказал "какую отвратительную рекламу Макдональса в блогах устроили".
Далее, нужно понимать, что для ТОПа то, что было неделю назад - уже неинтересно. Когда-нить я нарисую диаграмму того как первые сутки живет новость в блогосфере, чтобы наглядно обозначить место топа в этой жизни и то, где появляются спамеры и накрутчики.
И последнее - появление YandexAPI - я считаю шагом назад. Так как в некоторых топах мы перешли назад от автоматического топа к полуручному (слон.ру). Во-вторых, все работают с одинаковым векторынм пространством, поэтому с точностью до конформного сдвига автоматические топы будут находить максимумы одни и теже, только в разной последовательности. Также опасения вызывает координата отвечающая за кол-во ссылок, ибо постов в блогосфере с хорошими ссылками у нас настолько мало, что не хватит и на 2 топа, поэтому можно видеть, что в топ попадают записи и без ссылок, но сильно обсуждаемые.

Вообщем читайте ТОП30 от топбота, который в блогосфере уже 4 года. На днях уже пробили 3000 просмотров в день на ТОП30, а если учесть 2тыс просмотров у topbloger.livejournal.com - то это уже 5 тыс просмотров в день.

Метки:   Категории:Blogs | life


- yandex.blogs

Вот и убрали с главной Яндекса рейтинг блог постов блогосферы, теперь у нас более 20 рейтингов. Также добавили новый раздел "новости в блогах" - почти тоже самое, что и темы дня - польза нулевая, зато новая возможность для спамеров нагнать себе трафик. Вообще если приглядеться, то треть топов сделана сеошниками для нагона трафика, треть - скучающими фрилансерами, а треть - новостными порталами и пиарщиками. Все они на перебой говорят об своей уникальности - которая на самом деле позаимствована с других; о своих гиганских планах - когда нет честной монетизации; и а своих крутых алгоритмах - хотя у некоторых в итоге будут сидеть модераторы или топ составляться по спискам бана и разрешенным блогером.
И только топ30 для топбота - белая ворона, был сделан только потому, что, блять, 4 года уже занимается сбором популярных записей и глупо сейчас все бросать. По случаю обновил дизайн на ТОП30 - стало лучше =).

А самое интересное, что ни пользователи, ни блогеры, ни инвесторы, ни рекламщики - не хотят иметь 20 топов, все хотят иметь 2-3, а для этого придется ждать где-то 2 года, пока все вымрут, а там глядишь и блоги никому уже нужны не будут - все будем сидеть в Фейсбуке =).

Метки:   Категории:Blogs | Yandex | life


noindex - Неиндексируемый контент

Еще одна актуальная проблема создания ТОПа, с которой придется столкнуться всем - когда сам автор не хочет попадать в ТОП. Для этого ему логичнее всего поставить настройку в ЖЖ "не учавствовать в индексации". Технически это выражается в добавлении тэга noindex. Но ЖЖ такой нехороший, что продолжает выдавать данные по RSS, что позволяет все равно попадать в ТОП, а вот Яндекс, с другой стороны, поступает честно и не индексирует записи, что заметно усложняет анализ "топовости" поста. Но с другой стороны, если автор не захотел поисковой популярности, почему бы нам не пойти ему на уступку и отбрасывать запись.

И более сложный вопрос, а что если модераторы сообщества запретили индексацию, а автор и не знал об этом, как это случилось с популярной записью в следующем сообществе - http://community.livejournal.com/positive_adopt/117852.html. Вроде бы автор не виноват, писал хороший текст, старался, а тут облом и не пришла популярность. Видимо именно для таких случаев придется сделать исключение. А Вы что думаете?

Метки:   Категории:Blogs | Yandex


Рейтинг блогосферы - пост 4 (про ссылки)

Примечательно, что с каким бы программистом я не начинал обсуждать алгоритм составления ТОПа, в итоге каждый говорил, что вот он сейчас пойдет создаст сайт, выложит там новый ТОП и станет популярным. Это с одной стороны хорошо, так как показывает, что программисты - люди дела и любители играть в разные алгоритмы, а также мечтают стать знаменитыми. Но с другой стороны показывает, что они не понимают
1) Как работать в команде,
2) Что так как все работают с одним векторным пространством и одинаковыми сырыми данными, то в итоге рейтинг у всех будет совпадать в значительной степени.(~20%)
3) Самая сложность не в первоначальной сортировке, а в последующих фильтрах, которые должны отсеять спамерские посты. А спамерские посты чаще всего имеют ссылки как входящие, на сам пост, так и исходящие - на рекламу - которые нужно уметь определять и фильтровать. Вот об этом алгоритме работы нового ТОПа и поговорим.

После 4х летнего изучения топов я с полной уверенностью могу сказать, что нет смысла составлять списки бана, то есть лишать определенныз определенных блогеров шанса попасть в ТОП. Ибо это равносильно тому, чтобы посадить своего модератора, так как спамер может создавать новые блоги каждый день. В связи с этим логичным видится
1) фильтр по ссылкам, которые содержаться в посте - то есть все ссылки должны проходить проверку через сервис opendns, чтобы исключить ссылки на фишинговые сайты в топе или на сайты с вирусами. Минус - медленная работа по отбору записей, поэтому я пока ограничился самосоставленным списком с плохими ресурсами. И если в после есть ссылка на плохой ресурс, то пост не попадет в топ. Также я расматриваю вариант, когда на наличие плохих ссылок будет анализироваться вся главная страница блога и страница профиля, так как вероятно их откроет человек захотевший узнать побольше об авторе ТОПа и этим тоже пользуются спамеры.
2) ссылки на популярные сервисы сокращения ссылок (bit.ly) можно пока не фильтровать, так как эти сервисы сами заинтересованы в фильтрации ссылок на фишинговые и вирусные сайты.
3) Ранее я упомянул фильтр на локальный экстримум - он заключается в том, что проверяется, что за локальный период времени ссылок именно на этот пост блогера было больше всего или комментариев было больше всего. Это прежде всего позволяет отфильтровать тех у кого есть трансляции и у кого стабильно по несколько ссылок между своими трансляциями. Также отфильтрует тех, у кого стабильно много комментариев, например из-за спама в комментариях.
4) Анализируя спамерскую активность я пришел к выводу в необходимости фильтра "LinksIntegrity" - задача которого проверить все ссылки на расматриваемый пост, отбросить одинаковые, отбросить те, которые сделаны из сообществ и отбросить все ссылки с микроблогов. Повышенная активность в микроблогах и то, что там почти каждый пост содержит ссылки - говорит о том, что нельзя микроблоги причислять к полноценным блогам. Кроме того в микроблогах сейчас каждый упоминание типа "@user" - считается ссылкой и это сильно перекосило рейтинг блогеров и вызывает недоумение в определенных кругах. Итак, после отбора ссылок, проверяется, что оставшееся число ссылок достаточно для того, чтобы интегральная характеристика поста оставалась среди 20% постов с наибольшим значением.


Метки:   Категории:Blogs | Analytics | topbot | Code


Рейтинг блогосферы - А что всем нужно?

В рамках открытого обсуждения нового алгоритма ранжирования записей блогосферы собраны следующие пожелания к обновленному топу. Эти условия необходимо выполнить, чтобы ТОП блогов, как социальное явление не был полностью дискредитирован теми, кто хочет на нем лишь заработать:

  • Сводный рейтинг записей, который было бы интересно читать.
  • Сводный рейтинг записей, в который при необходимости можно было бы попасть.
  • Несколько разных страниц с разным дизайном, но одинаковым содержанием, чтобы не винить одну сторону во всем.
  • Достаточную посещаемость у рейтинга, чтобы рекламодателям было бы интересно.
  • Единую систему ценностей, чтобы попадание в ТОП – что-то значило как достижение.

Метки:   Категории:Blogs | idea


GoogleDevDeay 2009

Пару слов о . План минимум выполнен - попили, поели, футболку получили. В остальном же не был особо поражен наработками гугла, такое чувство, что переделываются в Open Source все наработки Микрософта. Только для бизнеса Open Source не вариант - ибо если что-то непонятно или не работает, то кто должен отвечать или чинить? Вот на той же схеме с синхронизированными данными сервер-сервер в GoogleWave мне бы обязательно задали вопрос - а что будет, если один из серверов вырубиться в процесе такого обмена... как будет реагировать второй.

Посмотрел еще раз на моего любимого Chrisa Chabota (любимый, так как похож на Гомера Симпсона), занимающегося http://ActivityStrea.ms, правда он до сих пор пребывает в заблуждениях, разбивая социально значимый объект на 3 части, а не на пять, как я рекомендую, забывая о еще не созданном 8м семантическом инварианте - мониторинге. То есть "социально значимый объект" в сети должен состоять из "Idendity"(я-вася), "Relations"(знаю Петю), "CurrentState"(часто меняющиеся переменные, такие как локация или список используемых приложений), "Activities"(список посещенных мероприятий, сделанных постов), "Statistic" (например, блог ведется 2 года, запощено 100 постов).

Далее подловил главного по GoogleWave - спросил, собираются ли они делать из WaveID распределенный идентификатор, чтобы я мой шарить не только личные данные, но и текущие активные вавлеты, через которые со мною можно было бы связаться. Он сказал, что не думал еще про это, но идея очень интересная.

И в дополнение, на
ugotrade вышла очередная большая статья, рассказывающая про будущее Дополненной реальности и создание так называемого OuterNet'a - то что прийдет на смену InterNet'u.

Метки:   Категории:Blogs | trend | Google


F5 today

Почитал сегодняшний номер журнала F5. В целом как обычно - отсутствие собственных мыслей и куча копипастов из интернета дополненных развлекательными картинками. Хочу прокомментировать историю про черно-белые мультики Mr.Freeman. Примерно 2 года назад в сети появилась книга, которую можно было бесплатно скачать и активно распространялась среди разных вирусмейкеров рунета. Книга называлась "Войны креатива" и как раз повествовала о русском креативщике, который анонимно завел блог в интернете и постил креативы. Его целью было активизация российских умов с целью создания нового товара экспортируемого на запад - креатива. Российского креатива, который бы составил конкуренцию западному креативу, какой-то там фирмы. Вообщем тым была долгая история, но можель исполнения и ключевые фразы совпадают. Помню еще тогда мне говорили, что типа - давай организуем блог креатива, сделаем революцию в умах... но я не ведусь на подобный бред.

Примечательно также, что из газеты убрали небольшой блог с самыми интересными блогпостами за неделю, хотя и топ яндекса еще жив и мой deep-water.ru (на который они ссылались, но данные которого не релевантны) тоже еще жив.

Метки:   Категории:Blogs | news


Новости в IT

Привлекла мое внимание новость об открытии технологического центра в Москве от Микрософта - стоимостью аж 300 млн.руб, причем крупнейший в Европе, неужели больше ни одной стране не нужен? Центр создан с целью тестирования крупно масштабных IT-решений российских компаний. И вот тут мне режет глаз цифра в 300 млн. - ведь именно такой бюджетный расход у нашего МВД за последние 3 года на технологическое обеспечение от Микрософта. Это не только "лицензионная винда", но и услуги консультантов, mssql сервера, biztalk сервера, сертификационные курсы админов - как раз все то, что покупалось для создания "крупно масштабного IT-решения". И для чего центр - чтобы дальше доить дойную корову. С других стран Восточной Европы видимо нет такого хорошего удоя.
В итоге хороший, хоть и не совсем корректный, пример того, как деньги от глупых перетекают к умным.

Кроме того, меня порадовала фантазия журналистов про яндекс топ, которая не имеет под собою фактов, и все утверждения в ней можно доказательно опровергнуть, но я не буду себя утруждать.

Метки:   Категории:Blogs | Yandex | news | idea


Рейтинг Блогосферы - ОБНОВЛЕНИЕ

На днях в СМИ появились непонятные статьи о том, что рейтинг русскоязычных блогов закрывается. Тут стоило прояснить, что ничего не закрывается, а произойдет лишь обновление алгоритма ранжирования записей и то, в декабре этого года. Все самые обсуждаемые темы по прежнему будут доступны через сеть блогов topbot.ru и вся статистика будет доступна все там же - topbloger.ru. Необходимость обновления алгоритмов работы ТОПа обусловлена большим числом рекламных сообщений, которые стали попадать в ТОП. Последней каплей стало попадание 31 октября 4х записей одинакового содержания "МВД РАЗГОНЯЕТ ПЕНСИОНЕРОВ". Найти эти записи можно на странице, введя в поиск по названию указанную выше фразу (После того как мне позвонили с требованием убрать их - я стер часть копий). Перейдем теперь к рассмотрению алгоритма ранжирования самых обсуждаемых тем русскоязычной блогосферы. Новой его особенностью будет то, что алгоритм помещения записи в ТОП будет публиковаться открыто в моих блогах. До момента обновления я буду результаты работы нового алгоритма доступны на странице beta.topbot.ru Итак, как же работает ТОП? Имеется еженедельная куча всех стоящих для прочтения постов. Для каждой записи строится оценочная функция. Исходя общей теории экспертных оценок имеем, что вес записи в блоге равен композиции трех функций BlogPost(n) = F(comms,views,commenters,links)*H(comms,views,commenters,links)*C(theme,copies,time) - функции состояния объекта, истории объекта и функции коррекции от связей объекта с экспертной системой.Далее...

Метки:   Категории:Blogs | topbot | Yandex


Yandex: Экстрасенсы и кривые алгоритмы.

С каждым днем все больше поражаюсь тому, что происходит на страницах Яндекс поиска по блогам. Сегодняшний день не стал исключением. Сегодня в десятку самых популярных блогеров вошел некто Мехди Вафа с блогом на майл.ру. Историю его роста можно увидеть на топблогере. И если год назад нахождение в 10-ке рейтинга одного дневника с майл.ру было уже чем-то подозрительным, то сейчас там "висят" целых 2. Итак, Мехди Вафа возглавляет центр экстрасенсов (боюсь назвать их шарлотанами, а то мало ли что наколдуют), поэтому выбор площадки майл.ру для ведения дневника - вполне обоснован. Далее, как говорит нам Yandex, у дневника аж 75тыс друзей, в то время как сам mail.ru показывает только 10тыс читателей(ps: на этой странице переключение вкладок под оперой не пашет). А 100тыс - это число тех, кто имеет доступ к его записям, но не читает регулярно в ленте. Это известное искажение понятия "дружбы" на mail.ru, помогающей ей строить красивые рекламные отчеты о раскрутке брэндов. Странности добавляет то, что уважаемый Вафа день назад закрыл дневник ото всех, кроме друзей, и теперь мы имеем один из самых популярных дневников по версии Яндекса закрытым. В любом случае будем надеется, что такая ошибка рейтинга - следствие африкаского аутсорсинга у наших чернокожих братьев(а не желание отдельных личностей творить кривой рейтинг) - будет исправлена в кратчайшие сроки и все виновные будут скормлены акулам. Далее...

Метки:   Категории:Blogs | bugs | Yandex


Spam at Blogs.Yandex page

На днях обнаружил, что спамеры успешно порвали рейтинг Яндекса по блогам. Удалось им это сделать с помощью рейтинга по посещениям. Если его открыть, то там все записи копируют друг друга и содержат рекламу. При этом цифры показывающие число просмотров у записей просто зашкаливают, вероятно спамеры просто покупают порнотрафик или трафик с маркетгрида. Вариант, что Яндекс криво считает посещения - отпадает, так как если взглянуть на сообщения в сообществе talking_room, то они все до единого попали в ТОП по посещениям, при этом вначале делался пост, а потом накручивался трафик. Также это доказывает, что кривой алгоритм Яндекса не ищет дублирующие сообщения в ТОПе.

Разобраться с этой ситуацией в интересах не только Яндексу, но и блогохостингам (ЖЖ в частности), так как эти посты содержат рекламу, с которой ЖЖ ничего не получает.

Метки:   Категории:Blogs | bugs | Yandex


Inside: Яндекс у берегов Африки

Анализируя выдачу Яндекса случайно наткнулся на ссылку на домен YANDEX.ST, где лежала картинка http://yandex.st/ppb/2.5/i/lj_community.gif. Зачем вдруг Яндекс решил мне выдать картинку с далекого сервера - загадка. Как оказалось домен действительно принадлежит Яндексу и был заведен всего МЕСЯЦ НАЗАД одним из его сотрудников. Если расшифровывать ссылку на картинку, то "PPB" - это "Поиск по блогам", "2.5" - версия. Если предположить, что на основной странице по блогам находится версия 2.0, то неисключено, что кто-то разрабатывает и/или тестирует систему мирового охвата.

PS: Доменная зона .ST принадлежит "Демократической Республике Сан-Томе и Принсипи" у восточного побережья Африки на островах с населением 160тыс. чернокожих потенциальных сотрудников Яндекса.

Метки:   Категории:Blogs | Yandex | idea


Statistics of Blogs.Yandex

Прошло ровно 5 месяцев с того момента как Яндекс поменял страницу с ТОПами по блогам, заменив ее на 4 рейтинга: сводный, комментарии, ссылки, посещения.
За эти месяцы во все четыре рейтинга попало примерно 13500 уникальных постов. Это 2700 постов в месяц или 90 постов в день. Примечательно, что 389 поста сумели засветиться во всех четырех рейтингах 1191 в трех из четырех и 9222 - в двух. Таким образом, с вероятностью 70% пост, попадающий в один из ТОПов, попадет в еще один ТОП. И можно сделать вывод, что это неспроста и рейтинги взаимозависимы и ТОП Яндекса по блогам, как система оценки качества поста, реализован коряво. Как следствие мы наблюдаем посты одних и тех же личностей на всех 4х страницах и только иногда проскакивают никому неизвестные блогеры.

Метки:   Категории:Blogs | Analytics | Yandex


TheNextWeb.com

Один из моих любимых для чтения блогов - TheNextWeb.com - теперь ведется на десятке языков мира. В том числе и на русском. За рускоязычную версию отвечает некто Сергей Беганский. Лично для себя, я не вижу смысла в запоздалом русском переводе того, что можно прочесть на английском, однако, подобные шаги могут уменьшить количество тех, кто тупо делает переводы западных статей и выкладывает себе в блог.

Еще рекомендую посмотреть свежее интервью с Бернстом Ли, где он говорит, в частности, что двойной слэш после http: было ошибочно, стоило ограничиться один.

Метки:   Категории:Blogs | Semantic Web | news


Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner

Мои Твиты

Twitter января 16, 16:22
Разбор Звездные войны: Последние джедаи http://dlvr.it/QBSdwN https://twitter.com/f1ashr/status/953301465962921985/photo/1

Twitter января 14, 19:00
8 японок основали поп-группу для пропаганды криптовалют http://dlvr.it/QBC3cw https://twitter.com/f1ashr/status/952616326605938688/photo/1

Twitter января 7, 10:12
Белый шум защищен авторским правом на youtube http://dlvr.it/Q9DFXS

Twitter января 1, 20:52
Новогодние белки http://dlvr.it/Q8SyPZ https://twitter.com/f1ashr/status/947933468222152704/photo/1

Twitter января 1, 16:43
Популярные блогеры и посты за 2017 год http://dlvr.it/Q8RpTj https://twitter.com/f1ashr/status/947870931896082433/photo/1

Twitter января 1, 15:37
@true_policy @nickolas_vs @KremlinRussia @iremeslo Но Путин делает все, чтобы выборная система в глазах аборигенов стала нелегитимной.

Twitter января 1, 11:32
@true_policy @nickolas_vs @KremlinRussia @iremeslo Нужен не новый президент, а другой система. От демократии к респ… https://twitter.com/i/web/status/947792574697431040

Twitter декабря 31, 21:11
Самоуправляемые ездящие картошки http://dlvr.it/Q8MGMd

Twitter декабря 31, 13:34
Разбор сериала Медичи: Повелители Флоренции http://dlvr.it/Q8KDRt https://twitter.com/f1ashr/status/947460855972601857/photo/1

Twitter декабря 31, 11:32
Папа Римский выступил на TED http://dlvr.it/Q8Jjb5

Twitter декабря 31, 10:25
коломенский кремль: альтернативная история 2 http://dlvr.it/Q8JRYv https://twitter.com/f1ashr/status/947413453701971968/photo/1

Twitter декабря 31, 10:25
Суперлайки в Перископе http://dlvr.it/Q8JRYr

Twitter декабря 30, 15:16
Peace, Death! (Пиз Дец) http://dlvr.it/Q8Cv1S https://twitter.com/f1ashr/status/947124264259395584/photo/1

Twitter декабря 30, 15:16
Итоги 2016 года в Живом Журнале http://dlvr.it/Q8Ctw6 https://twitter.com/f1ashr/status/947124257149956096/photo/1

Twitter декабря 30, 13:39
Разбор сериала "Молодой папа" (теория общего знания, часть 22) http://dlvr.it/Q8CP7P https://twitter.com/f1ashr/status/947099721675370496/photo/1

Twitter декабря 30, 13:05
Механического медведя не починить - пятая песня FNAF http://dlvr.it/Q8CDG8 https://twitter.com/f1ashr/status/947091170844278784/photo/1

Twitter декабря 30, 10:55
Skype and Baidu links http://dlvr.it/Q8Bf03

Twitter декабря 30, 10:23
Яндекс атаковал Израиль http://dlvr.it/Q8BWKR

Twitter декабря 30, 10:23
По случаю 8 марта погасили статую свободы http://dlvr.it/Q8BW9V https://twitter.com/f1ashr/status/947050399160156161/photo/1

Twitter декабря 30, 10:23
Рутин тутин Путин http://dlvr.it/Q8BW8y

Мой твиттер

Копирайт

Все мысли, высказанные в блоге, являются моим мнением и за это мнение меня никто не забанит! Кроме того, никто не имеет право копировать материалы блога без использования ctrl+C/V!

© Copyright 2008