Yandex: Экстрасенсы и кривые алгоритмы.

С каждым днем все больше поражаюсь тому, что происходит на страницах Яндекс поиска по блогам. Сегодняшний день не стал исключением. Сегодня в десятку самых популярных блогеров вошел некто Мехди Вафа с блогом на майл.ру. Историю его роста можно увидеть на топблогере. И если год назад нахождение в 10-ке рейтинга одного дневника с майл.ру было уже чем-то подозрительным, то сейчас там "висят" целых 2. Итак, Мехди Вафа возглавляет центр экстрасенсов (боюсь назвать их шарлотанами, а то мало ли что наколдуют), поэтому выбор площадки майл.ру для ведения дневника - вполне обоснован. Далее, как говорит нам Yandex, у дневника аж 75тыс друзей, в то время как сам mail.ru показывает только 10тыс читателей(ps: на этой странице переключение вкладок под оперой не пашет). А 100тыс - это число тех, кто имеет доступ к его записям, но не читает регулярно в ленте. Это известное искажение понятия "дружбы" на mail.ru, помогающей ей строить красивые рекламные отчеты о раскрутке брэндов. Странности добавляет то, что уважаемый Вафа день назад закрыл дневник ото всех, кроме друзей, и теперь мы имеем один из самых популярных дневников по версии Яндекса закрытым. В любом случае будем надеется, что такая ошибка рейтинга - следствие африкаского аутсорсинга у наших чернокожих братьев(а не желание отдельных личностей творить кривой рейтинг) - будет исправлена в кратчайшие сроки и все виновные будут скормлены акулам. Далее...

Метки:   Категории:Blogs | bugs | Yandex


Spam at Blogs.Yandex page

На днях обнаружил, что спамеры успешно порвали рейтинг Яндекса по блогам. Удалось им это сделать с помощью рейтинга по посещениям. Если его открыть, то там все записи копируют друг друга и содержат рекламу. При этом цифры показывающие число просмотров у записей просто зашкаливают, вероятно спамеры просто покупают порнотрафик или трафик с маркетгрида. Вариант, что Яндекс криво считает посещения - отпадает, так как если взглянуть на сообщения в сообществе talking_room, то они все до единого попали в ТОП по посещениям, при этом вначале делался пост, а потом накручивался трафик. Также это доказывает, что кривой алгоритм Яндекса не ищет дублирующие сообщения в ТОПе.

Разобраться с этой ситуацией в интересах не только Яндексу, но и блогохостингам (ЖЖ в частности), так как эти посты содержат рекламу, с которой ЖЖ ничего не получает.

Метки:   Категории:Blogs | bugs | Yandex


Inside: Яндекс у берегов Африки

Анализируя выдачу Яндекса случайно наткнулся на ссылку на домен YANDEX.ST, где лежала картинка http://yandex.st/ppb/2.5/i/lj_community.gif. Зачем вдруг Яндекс решил мне выдать картинку с далекого сервера - загадка. Как оказалось домен действительно принадлежит Яндексу и был заведен всего МЕСЯЦ НАЗАД одним из его сотрудников. Если расшифровывать ссылку на картинку, то "PPB" - это "Поиск по блогам", "2.5" - версия. Если предположить, что на основной странице по блогам находится версия 2.0, то неисключено, что кто-то разрабатывает и/или тестирует систему мирового охвата.

PS: Доменная зона .ST принадлежит "Демократической Республике Сан-Томе и Принсипи" у восточного побережья Африки на островах с населением 160тыс. чернокожих потенциальных сотрудников Яндекса.

Метки:   Категории:Blogs | Yandex | idea


Statistics of Blogs.Yandex

Прошло ровно 5 месяцев с того момента как Яндекс поменял страницу с ТОПами по блогам, заменив ее на 4 рейтинга: сводный, комментарии, ссылки, посещения.
За эти месяцы во все четыре рейтинга попало примерно 13500 уникальных постов. Это 2700 постов в месяц или 90 постов в день. Примечательно, что 389 поста сумели засветиться во всех четырех рейтингах 1191 в трех из четырех и 9222 - в двух. Таким образом, с вероятностью 70% пост, попадающий в один из ТОПов, попадет в еще один ТОП. И можно сделать вывод, что это неспроста и рейтинги взаимозависимы и ТОП Яндекса по блогам, как система оценки качества поста, реализован коряво. Как следствие мы наблюдаем посты одних и тех же личностей на всех 4х страницах и только иногда проскакивают никому неизвестные блогеры.

Метки:   Категории:Blogs | Analytics | Yandex


TheNextWeb.com

Один из моих любимых для чтения блогов - TheNextWeb.com - теперь ведется на десятке языков мира. В том числе и на русском. За рускоязычную версию отвечает некто Сергей Беганский. Лично для себя, я не вижу смысла в запоздалом русском переводе того, что можно прочесть на английском, однако, подобные шаги могут уменьшить количество тех, кто тупо делает переводы западных статей и выкладывает себе в блог.

Еще рекомендую посмотреть свежее интервью с Бернстом Ли, где он говорит, в частности, что двойной слэш после http: было ошибочно, стоило ограничиться один.

Метки:   Категории:Blogs | Semantic Web | news


social project

Интересный конкурс проводит Комменрсант. Отобрано 22 компании, которые будут рассказывать о том, как они используют социальные сети для продвижения своих продуктов. Иными словами, о своих вложениях и успехах в социальной рекламе. Пока в опубликованных материалах я не нашел ничего интересного, но надеюсь со временем появится.

Метки:   Категории:Blogs


BlogsAPI published-FOAF-parser

После некоторых раздумий выложил исходники BlogsAPI в опен сорс. Мне не жалко, если кто будет их использовать для своих проектов, ведь главное, что они будут написаны на .Net. Большую часть Юнит-тестов я исключил из проекта, чтобы не палить пароли от реальных аккаунтов. Отдельно обращаю внимание на то, как с помощью библиотеки парсить FOAF файлы:Далее...

Метки:   Категории:Blogs | Twitter | Yandex | Code


RDF/FOAF: Start point

На днях сделал реализацию .Net парсера различных FOAF файлов публикуемых блогхостерами на базе простой XML сериализации в рамках библиотеки BlogsAPI. Планирую в ближайшее время выложить для всех. Надеюсь это упростит для многих понимание и использование информации публикуемой в RDF формате. Пока изучал различные модификации FOAF в рунете, составил следующий список некорректных на мой взгляд моментов:

FOAF (http://xmlns.com/foaf/spec/)
1) Тэг foaf:Person может содержать вложенный тэг foaf:Person. Это пережиток прошлого и может вносить путаницу в виде рекурсии.
2) Часто встречается неправильное использование тэгов "dc:*" как аттрибутов, вместо тэгов.
3) Много "мертвых" элементов в статусе "unstable" и "testing", а также многочисленные поля единого семантического свойства, но не объединенные единым тэгом. Например, yahooID, openid.
4) Формат разработывался с 2004года, и многие примеры в спецификации устарели, либо имеют неправильную запись. Однако, люди которые впервые знакомятся с RDF/FOAF принимают их как эталон и продолжают пложить ошибки.
5) Раздражает и усложняет сериализацию необходимость указывания тэга foaf:knows, вместо того, чтобы одним тэгом окаймить весь массив связей.


YaFoaf (http://api.yandex.ru/blogs/doc/indexation/appendices/foaf-profile-sample.xml)
1) Неправильная запись "<foaf:img>http://img.ya.ru/userpic/1051645/90316</foaf:img>",
правильно: <foaf:img rdf:resource="http://img.ya.ru/userpic/1051645/90316" />
либо: "<foaf:image>http://img.ya.ru/userpic/1051645/90316</foaf:image>"
2) Аналогично для тэга foaf:homepage
3) ya:firstNode, ya:middleName, ya:secondName - выглядят как тавталогия, если учесть что их аналоги есть в "foaf:"
4) "foaf:dateOfBirth" - такого тэга нет, правильно "foaf:birthday"
5) ya:blogActivity - идиотизм задавать его для каждого из 4х параметров, нет чтобы один тэг, а внутри 4 различных подкласса для постов, комментов, ссылок и читателей. Видно, что копировали форму записи с foaf:knows


FOAF на li.ru
1) Ya:RSS - удобная замена для ya:feed, Но не документирована
2) ya:location - тоже какая-то самодеятельность от лени.
3) foaf:name и foaf:nick заполнены как-то странно, в итоге в поле name всегда пишеться номер блогера в базе дынных


FOAF на livejournal.com
1) общая неточность с foaf:dateOfBirth вместо foaf:birthday
2) Вводится дополнительное пространство имен LJ, но можно было бы обойтись dc:title и dc:description, как аттрибуты foaf:Document.
FOAF на ya.ru
1) Нигде не заполнен "реальный" ник пользователя, придется его извлекать из урла.


Выводы:
1) Я бы пересмотрел бы весь формат и задал бы новый исходя из теории "Социально Значимых Объектов", разбив весь RDF файл на 4 секции, но это мечты.
2) Видно, что нет единства в формировании FOAF файлов и все относятся к этому спустя рукова, так как пользу это дает только примитивному поисковику по профилям блогеров.

Метки:   Категории:Blogs | Semantic Web | Yandex


ТОП: Себя не похвалишь никто не похвалит.

Всегда поражался темам о том, как кто-то попал в ТОП30 и рассказывает о том, сколько он приложил для этого усилий и не потратил и копейки. Очень познавательно почитать про "прогрессивные пиар-технологии рунета". Обычно это клиника и человек после такого становится обычным "троллем ЖЖ". Любой потенциальный троль, попав в ТОП, начинает чувствовать собственную силу и значимость, что и вызывает обострение болезни мании величия.

Единственное, что огорчает, не удалось найти текст его креатива, ибо во всех сообществах, куда писал автор его уже успели забанить, а топбот не скопировал запись "Приглашаем всех на праздник!" сообщества а этот день.

Метки:   Категории:Blogs | humor


Смерть ЖЖ

После того, как я подсунул Фицпатрику, создателю ЖЖ, недавно приезжавшем в Москву, ссылку на его интервью в Ведомостях. Бред написал ответный пост ругающий перевод в статье и пошла непонятная ругань от известных людей на тему "А умирает ли ЖЖ?". Причем ругают всех и СУП, который руководит ЖЖ, и Google, который согласовал с Ведомостями такую версию перевода, и Бреда, что пора ему про ЖЖ забыть и делать свою работу. Во общем, вся краса русской блогосферки напоказ.

Между тем, несколько трендов в ЖЖ.
Положительные 1) Число платных аккаунтов растет. 2) ЖЖ крепко связан обменом данными с Яндексом. 3) В ЖЖ есть блог Медведева.
Отрицательные 1) ЖЖ убрало поддержку Jabber и вставила Мессенжер от Микрософта - LjTalk. 2) Рекламы в ЖЖ стало последнее время заметно больше. 3) Рост числа спамеров.

Метки:   Категории:Blogs | Livejournal | news


Source Codes of Livejournal.ru

Продолжая тему незакрытого SVN - обнаружился доступ к исходным кодам написанным в компании СУП, а именно к ЖЖ - http://www.ljdev.livejournal.ru/.svn/text-base/. Обращаю внимание, что по некоторым ссылкам перебрасывает на 8081 порт, видимо на котором и должно работать SVN, но криворукость настройки сайта не мешает скачать коды по 80му порту.
Напомню, что большая часть кодов Живого журнала доступна в сети интернет как open source, поэтому по приведенной ссылке стоит обратить внимание только(!) на файлы с расширением ".sup" - это файлы, которые были дописаны суповскими программистами и возможно содержат уязвимости. Думаю, недавно приезжавший в Россию Фицпатрик порадовался бы за то, как заботятся о его детище.

Бонус - свежее фейковое видео со взломом чужого компьютера при помощи почтового вируса

Метки:   Категории:Blogs | bugs | Livejournal


Yandex.Blogs : Search form for your blog!

Только что на Яндексе появилась новая возможность, связанная с блогами. Теперь вы можете вставить форму для поиска по своему блогу на страничку своего сайта-блога. Таким образом, Яндекс хочет увеличить посещаемость поиска по блогам, которая на сегодняшний день составляет порядка 250тыс. чел. в день:
Установите в своём блоге, форуме или на блогосервисе форму поиска. Это позволит вам не потеряться в записях и комментариях и быстро находить там нужную информацию.

По сути ничего сверх-нового. Открытым остается вопрос: "Добавят ли мой блог в список индексируемых яндексом, если я на него повещу такую форму" - Ведь как же я могу искать в своем блоге, когда его не в индексе? Напомню, что мои автоматические блоги типа topbot.ru - не присутствуют в индексе яндекса по причине слишком частого обновления контента - примерно 50 сообщений в день.

Метки:   Категории:Blogs | Yandex | news


Сайты продажи трафика.


Примерно полмесяца назад посещаемость одного моего проекта резко выросла без особых причин. Виною тому стал сайт по продажи трафика, который видимо таким образом хотел мне разрекламировать свои услуги. Адрес этого сайта можно было легко увидеть по реферу откуда пришли посетители. По этой причине многие сайты, которые реально покупают трафик с порноресурсов, в открытой статистике типа liru закрывают общий доступ к информации об источниках переходов. Но я не закрываю, мне бояться нечего.

Как видно из "итогов" такого нагона трафика, люди не задержались на сайте. Отсюда вывод, что порнонакрутка - бесполезна, если Вы не хотите всю жизнь платить за виртуальные посещения.

Метки:   Категории:Blogs | life


Причуды Blogs.Mail.Ru

Некоторые популярные российские сервисы поражают своим качеством. Речь пойдет не о скопированных с запада социальных сетях, а о простом и достаточно известном блогодвижке на mail.ru, о котором можно складывать байки особенно после того как их ломанули в 2005году. Итак,
  • Этот замечательный сервис имеет жесткую модерацию постов, поэтому заметная часть ТОПов яндекса туда просто не копируется с ошибкой об использовании "запрещенных слов". Моя основная претензия к ним. К запрещенным словам относится не только мат, но и упоминание бесплатных хостингов типа letitbit.net. Последнее весьма логично, и наверняка спасает немало хомячков от ссылок на вирусы.
  • Интерфейс работы с новыми записями не работает при отключенном HTTP_REFFER у браузера. В итоге мне пришлось открыть, как и большинство хомячков - IE8 и выполнить нужные действия.
  • Не фильтруется поле года поста - я могу поместить туда любое безнаковое целое число, тем самым сделав пост от 1го года
  • И совсем смешно смотрится куча '\n' которые вставлены в начало любой страницы ответа сервера, чтобы эмулировать белую страницу для неопытных пользователей, которые вдруг решат посмотреть исходник html.

Метки:   Категории:Blogs | bugs


top4blog.ru

Обновил вчера сайт top4blog.ru, добавив на главную страницу список самых читаемых постов блогосферы за неделю. Количество просмотров определяется не только по данных Яндекса, но и по счетчикам, которые встраиваются в комментарии к топовой записи. К сожалению, как видно из таблицы, кроме другого и темы хомячки почти никого не читают.

Метки:   Категории:Blogs | topbot


Yandex.Blogs - commentors

Только сейчас заметил, что в топе яндекса по комментариям написано число "комменТАТОров", а не "коменТАРИев". Это может означать лишь то, что на попадание в ТОП влияет число различных блогеров (ботов, виртуалов и т.п.) прокомментировавших запись, а не общее число комментариев, как может показаться.
К слову, чтобы попасть в топ блоговых записей Лиру достаточно 3х человек, которые активно накидают комментарии за короткий промежуток времени.

Метки:   Категории:Blogs | Yandex


Рейтинг авторитетности блогов

Давно уже не слежу за авторитетностью блогов ввиду ее сильной неадекватности, однако, вчера в ней случился очередной пересчет рейтинга, который сделал замедные передвижки среди блогеров. Не исключаю, что были даже сделаны какие-то изменения в алгоритмах Яндекса. Следствием изменений стало то, что опять какие-то левые люди с полуспамовыми блогами приподнялись: 1, 2, 3.
И в довершение маразма можно видеть, что "очень популярный" корпоративный блог яндекса находится одновременно в лидерах рейтинга как среди блогеров, так и среди сообществ.

Метки:   Категории:Blogs | Yandex


ТОПБЛОГЕРы РУнета

После некоторого гемора выложил новый сайт для тестирования, а точнее даже два: topbloger.ru и смежный ему top4blog.ru. Первый содержит информацию обо всех топовых блогерах, а второй просто набор постов, попавших в топ. Зато теперь информацию искать удобнее и выглядит красивее чем на моем же deep-water.ru. Для полной красоты не хватает возможности автоматически извлекать ссылку на кэшированную копию поста в Яндексе. Из приятных возможностей - RSS подписка на топовые записи определенного блогера, а также то, что можно давать ссылки на "карточки топблогеров" как со знаком вопроса, так и без, что упрошает запоминание адреса.

Монетизация проекта возможна через размещение платных ссылок на рекламные агенства или добавление(убирание) информации о платных постах блогера.

Метки:   Категории:Blogs | topbot | Code


Twitter API

Все знают, что у твиттера есть API для разработчиков, но мало кто реально им пользуется. Обычно все находят программы уже созданные кем-то на западе. Если же у вас необходимость создать какое-то приложение для твиттера на .Net, то рекомендую достаточно молодой опен-сорс проект Twitterizer. Ниже много кода, демонстрирующие как просто я добавил возможности твиттера в библиотеку BlogsAPI (закрытый проект пока): Далее...

Метки:   Категории:Blogs | Twitter | Code


Gender Customization for Topbot

Ранее я уже высказывал мысль, что нам нужен топ по блогосфере разделенный на 3 части - тексты, картинки, видео. При этом важно, чтобы этот топ удобно было читать с мобильника, особенно первые 2 категории. Сегодня меня посетила мысль, что все записи в топе еще можно поделить по гендерному признаку. Вот мне, например, абсолютно не интересно читать про кулинарные рецепты или про конкурсы красоты. Выделить гендерную тематику поста можно по количеству скачку переходов на пост определенного пола, при условии, что мы умеем выделять пол посетителей.

В пользу необходимости гендерного деления топа говорит рост популярности на западе таких проектов как http://girlsguideto.com/ - предоставляющих закрытую соц. сеть для девушек. У нас, например, популярно сообщество на ЖЖ ru_girls (кому нужен инвайт обращайтесь).

И в заключение, смешное видео в тему поста, посвященное борьбе за девушек в природе. Очень важно смотреть дальше 2х минут.

Метки:   Категории:Blogs | topbot | idea


Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner

Мои Твиты

Twitter октября 8, 21:44
Рынок крипто-валют вырастет еще в 5 раз http://dlvr.it/QmjhwH

Twitter октября 8, 20:40
27 февраля - день ССО http://dlvr.it/QmjT8r https://twitter.com/f1ashr/status/1049399049172922368/photo/1

Twitter октября 8, 14:40
Затерянные в космосе 2018 http://dlvr.it/QmgnHg https://twitter.com/f1ashr/status/1049308614962212865/photo/1

Twitter октября 8, 14:40
Электрические сны и 300-летняя бабка http://dlvr.it/QmgnHb

Twitter октября 7, 15:54
Соц.медиа http://dlvr.it/Qmb3Wh

Twitter октября 7, 15:54
google plus search http://dlvr.it/Qmb3WZ https://twitter.com/f1ashr/status/1048964874645123073/photo/1

Twitter октября 7, 15:21
Статья в РИА про современные медиа http://dlvr.it/QmZxB9

Twitter октября 7, 15:21
Немного про UTF-16 и отличие от UTF-8 http://dlvr.it/QmZxBB

Twitter октября 7, 15:21
Вакансия в СУПе http://dlvr.it/QmZxBH

Twitter октября 7, 15:21
Azure Storage http://dlvr.it/QmZxB4

Twitter октября 7, 15:21
Agava RIP http://dlvr.it/QmZxB5

Twitter октября 7, 14:37
Amazon RDS with SQL Server http://dlvr.it/QmZmpq

Twitter октября 7, 14:37
Гипотеза: Осетин, учавствовавших в сбитии боинга-777, ликвидировали 22 ноября http://dlvr.it/QmZmpx

Twitter октября 7, 14:37
Windows Azure - на заметку http://dlvr.it/QmZmfT https://twitter.com/f1ashr/status/1048945313061326848/photo/1

Twitter октября 4, 11:32
Американские ученые начали искать спутники экзопланет http://dlvr.it/QmGlKF https://twitter.com/f1ashr/status/1047811593629720576/photo/1

Twitter октября 3, 06:38
Отравление в Волоколамске на примере Николая Телеги http://dlvr.it/Qm7ZcJ https://twitter.com/f1ashr/status/1047375383622967296/photo/1

Twitter октября 3, 06:38
Разбор сериала Видоизмененный углерод (Altered Carbon) http://dlvr.it/Qm7Zc7 https://twitter.com/f1ashr/status/1047375377813790720/photo/1

Twitter октября 2, 20:51
Ретро-поезд на угле с надписью СССР http://dlvr.it/Qm5jxv https://twitter.com/f1ashr/status/1047227501544595458/photo/1

Twitter октября 2, 20:51
Музыка про прилет Американцев на Марс http://dlvr.it/Qm5jgh https://twitter.com/f1ashr/status/1047227491394281473/photo/1

Twitter октября 2, 10:59
8 японок основали поп-группу для пропаганды криптовалют http://dlvr.it/Qm2pzG https://twitter.com/f1ashr/status/1047078505706545152/photo/1

Мой твиттер

Копирайт

Все мысли, высказанные в блоге, являются моим мнением и за это мнение меня никто не забанит! Кроме того, никто не имеет право копировать материалы блога без использования ctrl+C/V!

© Copyright 2008