Yandex.Blogs: BigBug

Сегодня обнаружил веселую особенность ТОП30, что на главной яндекса по блогам - по ссылке. Оказывается записи, что отображаются в общем списке простым текстом ОТЛИЧАЮТСЯ от тех, что попадают в RSS ленту. При этом в RSS ленту попадает меньше постов, чаще всего в RSS пропадают посты от тысячников и посты тролей, которые несодержательны. Это может говорить о двух вещах:
1. RSS кэшируется на большее время, нежели сама страница с топами. 2. Яндекс намеренно модерирует выдачу по RSS, удаляя оттуда все ошибки алгоритма, который после изменения стал хуже. В частности сегодня в RSS не попал пост про "МВД", который успел засветиться на главной странице.

Визуально вы можете сравнить выдачу топов сами - ТОП извлеченный из текста, ТОП из RSS

PS: Также не все наверное знают, что Яндекс. Блоги с недавнего времени активно поддерживают и внедряют traceping, по которому Вы можете настроить автоматическое уведомления Яндекса о новых постах в вашем дневнике, что ускорит индексацию. Почитать подробнее на этой странице.

Метки:   Категории:Blogs | bugs | Yandex


Яндекс.TOP30: общий анализ

После анализа вчерашних изменений на Яндексе, были сделаны некоторые выводы и изменения о которых раскажу ниже. Для начала установим следующую терминологию:
  • "Топ30" или "топ первого типа" (он же старый топ) - http://blogs.yandex.ru/entries
  • "Топ второго типа" или "топ по ссылкам" - http://blogs.yandex.ru/entries/links/
  • "Топ третьего типа" или "топ по комментариям" - http://blogs.yandex.ru/entries/comments/
  • "Топ четвертого типа" или "топ по посещениям" - http://blogs.yandex.ru/entries/visitors/

Сразу скажу, что ввиду того, что новые 3 ТОПа оказались гавном, то топбот ходит по записям лишь из "топ30". Такое чувство, что яндексовцы вообще не смотрели, что у них получается в новых топах, а просто выкатили новинку на всеобщий обзор. Очевидная проблема заключается в том, что в отличие от топа первого типа в остальные может попасть один человек и несколько раз или одна и таже обсуждаемая тема. По порядку, в топе по ссылкам мы сейчас видим 10(это одна треть!!!) постов блога http://neirolog.livejournal.com/, у которого у каждой записи по 11 ссылок - видать трансляции. Топ по комментариям - на вид выглядит красиво, за исключением того, что легко накручивается. Топ по посещениям - ну там один лебедев с 5ю постами, кому это интересно читать будет? А остальные посты про Red Bull Cola, одним постом на тему уж можно было бы ограничиться.

Пользуясь случаем переписать впервые за 2,5 года код, переделал загрузку топа на нормальные классы с помощью xml сериализации, вызов выглядит так
Copy Source | Copy HTML
[Test]
        public void GetYandexTop30()
        {
            PostWatch pw = new PostWatch();
 
            foreach (object toptype in Enum.GetValues(typeof(TopType)))
            {
                TOP30Result TopRSS = pw.GetYandexTop30((TopType)Enum.Parse(typeof(TopType),toptype.ToString()));
                Assert.IsNotNull(TopRSS);
                Common.dp("Загрузка топа типа " + toptype.ToString() + " завершена, найдено " + TopRSS.channel.tops.Count.ToString() + " постов");
                Assert.AreEqual(30, TopRSS.channel.tops.Count);
                Common.dp("Ожидание 5 секунд");
                Thread.Sleep(5000);
            }
        }
Скачать класс TOP30Result можно по ссылке
PS: однако для рекламодателей будет интересным и попадание в другие топы, поэтому вся статистика собирается и предоставляется.

Метки:   Категории:Blogs | topbot | Yandex


ЯНДЕКС. TOP30 ОБНОВЛЕНИЕ!

Чесно говоря такого не было уже 3 года. Яндекс решился на обновление страницы с топовыми записями блогосферки. Теперь она выглядит по новому. И позволяет Вам узнать количество комментариев, ссылок и просмотров у каждой записи. Как считаются просмотры пока не известно. Но не исключаю, что напрямую импортируются с блогохостинга. Не смотря на то, что кнопочек у топа стало больше, количество попадающих записей в ТОП за раз видать не увеличилось, все те же 30 записей.

ЗЫ: Добавление нового типа сортировок меня не радует. Придется сегодня кодить...

Метки:   Категории:Blogs | Yandex | news


Bye-bye Mail's communities

Давно я не открывал рейтинг авторитетности сообществ, а как оказалось, примерно месяц назад был изменен алгоритм авторитетности для СООБЩЕСТВ. Ранее там лидировали только сообщества из mail.ru , которые поражали невероятным числом участников. Ранее Яндекс нераз упрекали в бесполезности их рейтинга, если там только один mail.ru. Но теперь мы видим, что в десятку первых входят сообщества как и из ЖЖ, так даже и Яру затесалось. Если посмотреть количество участников этих сообществ, то видно, что у каждого примерно по 23тыс. читателей (это меньше чем сейчас френдов у фотографа - drugoi.livejournal.com).

Ниже вставлены графики, отражающие динамику авторитетности Яндекса для сообществ. Слева позиция сообщества от времени. Справа его авторитетность. Как видно, у сообществ mail.ru авторитетность в апреле начала резко падать пока не достигда уровня линейно растущих сообществ Яру и ЖЖ. Думаю такое возможно, если выкинуть из авторитетности учет числа участников, начиная с определенного числа и увеличить вес от ссылок с внешних сайтов.

Метки:   Категории:Analytics | Yandex


Соцопрос о слове BLOGGER

Несколько фактов про написание русского звучания слова BLOGGER:
  • По правилам переноса иностранных слов двойная согласная заменяется на одинарную, так для слова "shopping" - получаем русское "шопинг".
  • Яндекс всюду пишет с двумя буквами Г и отказывается исправляться ввиду того, что некоторые известные блогеры пишут с двумя Г и большинство пишет с двумя Г. А большинство пишет с двумя Г, так как Яндекс рекомендуется писать с двумя Г. Замкнутый круг.
  • Все СМИ пишут с одной Г, в том числе Медведев у нас видео блоГер
  • Сам самизнаете кто, размещает обращается к читателям с двумя Г
  • Орфографический словарь говорит, что должна быть одна Г.
  • Слово blogger произошло от комбинации web log, а уж логирование, логи - всегда пишутся с одной Г.
  • Я знаю всего лишь одно чисто русское слово, в котором пишется две Г подряд, но оно вышло из обращения 40 лет назад. Это слово - аггел, означавшее некое духовное зло («служителя дьявола»). Только зло в русском языке обозначали двумя Г.
  • В английском языке используется двойная G только для того, чтобы O перед G читалась, как О, а не как У. Если бы стояла одна Г, то слово bloger произносилось бы как блУгер.

Таким образом, даже после того, как президент завел себе блог, он не стал ближе к народу. Президент - блоГер. А мы - блоГГеры. =(. И вот небольшой опросик:

Метки:   Категории:Analytics | humor | Yandex


Советская армия и изнасилованные немки.

Так уж получилось, что информация лучше всего в ЖЖ распространяется с негативным описанием чего бы то ни было. И с наступающим праздником победы 9мая, это правило повторяется. В ТОП вылезло сообщение о том, как советская армия насиловала белокожих немок и прочие зверства, которые резонно просит убрать господин Клименко. На это яндексовцы ему отвечают, что "иди желоваться в СУП". Я бы еще пожаловался бы нашим молодежным организациям, типа наших и румола, которые постоянно накручивают в ТОП записи про свои политические акции. А вот вывести нормальную непроплаченную патриотическую тему в предверии праздника - не смогли.

Метки:   Категории:topbot | Yandex | news


В продолжение темы виджетов

Заработал таки виджет от Яндекса. Теперь я могу на главной странице читать о том, чтоже происходит в блогах. Всем кому также интеерсны блоги, могут присоединяться:

+ Самые обсуждаемые темы блогосферы!

добавить на Яндекс

Метки:   Категории:topbot | Yandex


Яндекс.Обновился

Сегодня Яндекс сообщил о возможностях создания виджетов для своей главной страницы. Я даже создал виджет с "Самыми обсуждаемыми темами блогосферы" =). Теперь на главной странице яндекса можно будет читать топ30 =).
Но виджеты - это все детские игрушки. По настоящему Яндекс меня удивил когда я открыл Яндекс.Блоги
Как показано на скриншоте слева внизу маячит "Сервисы микроблогов", смысла от этого списка 0! Единственное, что эта таблица может нам сказать, что все мы все равно будет сосать у Mail.ru, в то время как в среде коротких сообщений mail.ru сосет у icq.com. Вообщем смысла выделять столько места под неинформативную информацию я не вижу:

Кроме того обнаружил сразу 2 ошибки на соседней страницы о чем написал в суппорт:

ЗЫ: "Волосатая сосиска" - это не ошибка.

Метки:   Категории:bugs | Twitter | Yandex


Яндекс + футболка, кружка, ручка

Посетил Яндекс, посмотрел презентацию, о которой писал ранее.
Из интересного отмечу
  • Со слов Романа - любой, даже удаленный комментарий на ЖЖ теперь попадает в Яндекс, всегда.
  • На следующей неделе Яндекс обещает большой отчет по ситуации в Рунете. В частности напишут о том, что число блогов уже почти не растет, а вот комментариев становится все больше и больше за счет интеграции с новыми системами.
  • Антон обещает, что у ТОП30 появится выдача RSS... ыыы. Кроме того, судя по всему, он единственный человек, кто имеет право править(и правит) ТОП30 ручками в целях исключения ошибок роботов и матных постов.
  • Вся информация FOAF собранная Яндексом доступна по API.


Негативных сторон тоже не мало. Я заметил, что в команде Яндекса витают "мифы", которые видимо не скоро будут развенчаны. Вот то, что я заметил
  • По мнению представителя Яндекс.Новостей "новостное издание" отличается от "блога" тем, что последние пишут только гавно. В то время как, главное отличие блога от новостного источника заключается в том, что там может содержаться описание неактуальных событий.
  • Роман, как заклинание повторяет фразу "мы не медиа", думая, что это его спасет от вопросов, связанных с влиянием Яндекса на население. Но это влияние как не назовись есть, недаром оппозиция завалила вопросами о качестве автоматически выдаваемой информации и значимости частицы "НЕ" в выдаче.
  • Антон уверяет, что ТОП30 работает как положено. Одновременно с его словами в ТОП попадает запись http://deep-water.ru/?http://stanislav-mikov.livejournal.com/372390.html, чего по его уверению быть не может.

Вот такие дела. Фунболка не понравилась, кстати.

Метки:   Категории:topbot | Yandex | life


Еще один аспект неполноценности рейтингов.

На днях в рейтинге Яндекса по блогам был осуществлен пересчет данных по блогохостингу dairy.ru. В итоге все блоги с этого богом забытого места неплохо поднялись в рейтинге и этот рост стал замым заметным среди других блогохостингов. Таким образом, можно видеть, как значения рейтинга скачут в зависимости от того, кластер данных с какого блогохостинга решил Яндекс пересчитать.

Метки:   Категории:topbot | Yandex


Как работают Яндекс.Блоги?

Ответ на этот вопрос дал А.Волнухин 3го апреля, выступив перед группой зазванных журналистов, чтобы они пересказали это всем интересующимся и экспертам(накрутчикам). Подробный отчет о событии можно найти в блоге Людмилы. Я же выделю самое интересное и дам свои комментарии.

Цифры Яндекс.Блогов и основные сервисы



  • Миллион запиcей и комментариев из блогов и форумов каждый день
  • 7 млн. источников индексируется
  • индексируется 14 млн. профилей пользователей. Примерно половина пользователей создает блог и не делает там ни одной записи, а, например, использует для комментирования или забрасывает. Отсюда разница.
  • всего около миллиарда документов
  • блоги - одна пятая Рунета (по количеству элементов для индексации)
  • Новые записи индексируются в течении 10 минут на более чем 120 блогхостингах
Все похоже на правду. Обработать миллион в день - это далеко не предел.
Поиск - это самый нужный для людей сервис по блогам. Однако, многим интернет-маркетологам гораздо интереснее Топ Блогосферы.
Поиск по блогам - единственное, что нормально работает, а у ТОПа просто нет других аналогов, вот и пользуются. Вот и все объяснение.
Антон Волнухин, ответственный за поиск по блогам, рассказал, что "коммерческой ценности" пребывание в популярных записях не несёт - самый большой возможный трафик оттуда исчисляется единицами тысяч посетителей блога.
Мухаха. Да, чистая ссылка в Яндекс ТОПе получает порядка 2000 кликов, но ведь многие потом копируют этот текст. Так что суммарно эффективность доходит до десятков тысяч. Хотя известны примеры с тем же Воронежским конем, когда количество просмотров перевалило за 200тыс.

Какова же "формула ранжирования" записей в Топе Блогосферы?

  1. Записи сортируются по количеству ссылок на пост за последние три дня.
  2. В топ может попасть только блог, существующий более полугода
  3. ссылки за последние 8 часов имеют удвоенный вес - это нужно, чтобы топ чаще "освежался"
  4. Записи теряют вес каждый час нахождения в топе - с той же целью
  5. В топ может попасть одновременно не более 1 записи из 1 блога.
  6. Рейтинг пересчитывается каждые 20 минут
  7. Чем меньше раз тот или иной блог ссылался на блог, содержащий топовую запись, тем весомее ссылка.
Теперь стоимость полугодовалых виртуалов вырастет... Про то, что 1 блогер и один пост в одно время - я тоже когда-то верил, пока stanislav_mikov это не нарушил. Также последний критерий особенно интересен, так как теперь все начнут это использовать =)
Планируется добавлять больше источников данных для рейтингования - учитывать комментарии и посещаемость.
Нуну, вот этого точно НЕ надо делать.
В ближайшее время пользователи смогут посмотреть разные неотфильтрованные срезы по каждому из источников - и накрутки станут видны каждому.
А разве сейчас кому-то что-то неочевидно? А хомячки не станут пользоваться этими срезами.
Антон Волнухин с прискорбием признал тот факт, что управлять индексированием и участием в поиске своего блога его владелец может только при помощи писем в саппорт.
Я же с прискорбием признаю, что даже написание в суппорт в 70% случаях вам не поможет.
Главные проблемы поиска по блогам - это спам, фильтрация дублей, индексирование удаленных и скрытых записей.
Пока в Интернете не будет полноценного 5го(вся инфа о том кто пишет) и 9го(вся инфа о смысле того, что пишут) инвариантов семантического web'a, это так и будет проблемой.
Устройcтво Яндекс Блогов приведено на картинке ниже, вот уж не думал, что в нем найдется применения для SQLite

Метки:   Категории:Yandex | news


Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner

Мои Твиты

Twitter декабря 1, 15:49
Международная система единиц СИ http://dlvr.it/QsZWxP https://twitter.com/f1ashr/status/1068894908939784192/photo/1

Twitter ноября 30, 15:47
Пользователи умудрились поломать гео-локацию в Инстаграм http://dlvr.it/QsVQn0

Twitter ноября 30, 15:47
Популярные блогеры и посты за 2017 год http://dlvr.it/QsVQmn https://twitter.com/f1ashr/status/1068532024984498176/photo/1

Twitter ноября 30, 15:47
Разбор сериала Медичи: Повелители Флоренции http://dlvr.it/QsVQmf https://twitter.com/f1ashr/status/1068532019930353664/photo/1

Twitter ноября 29, 15:45
Обновлен робот instagram для лайков http://dlvr.it/QsPrh2

Twitter ноября 29, 15:45
Skype and Baidu links http://dlvr.it/QsPrht

Twitter ноября 29, 15:45
О смене дизайна Вконтакте http://dlvr.it/QsPrgT

Twitter ноября 23, 13:18
Статистика просмотров Телеграма http://dlvr.it/Qrwybs

Twitter ноября 20, 11:54
По-тихому закрылся http://taaasty.com http://dlvr.it/QrgcJf

Twitter ноября 15, 21:21
Разное - сетевое http://dlvr.it/QrLfbH

Twitter ноября 12, 08:54
@lopp @coinhive_com Beware, that coinhive doesnt process payouts for last month and no reply from them.

Twitter ноября 6, 08:26
@MultiFollow_com @coinhive_com The same, cant get payment since Oct 29

Twitter октября 29, 18:13
Вконтакте закрыла гео-поиск http://dlvr.it/QptcDZ

Twitter октября 29, 17:48
RT @t30p: Моя Борьба (Mein Kampf) - Мыслить №112 https://youtu.be/eq3r3n3jAkY с помощью @YouTube

Twitter октября 23, 17:57
8-й час в России http://dlvr.it/QpG99N https://twitter.com/f1ashr/status/1054793845546790912/photo/1

Twitter октября 18, 06:44
Яндекс атаковал Израиль http://dlvr.it/QnhhCy

Twitter октября 17, 16:07
Как разверифицироваться в Твиттере? http://dlvr.it/Qnddsc https://twitter.com/f1ashr/status/1052591848303120390/photo/1

Twitter октября 17, 16:07
На батуте в космос http://dlvr.it/QnddrT

Twitter октября 17, 16:07
Estonian Fitsme http://dlvr.it/Qnddn3

Twitter октября 17, 16:07
Россия будет воевать http://dlvr.it/Qnddq7

Мой твиттер

Копирайт

Все мысли, высказанные в блоге, являются моим мнением и за это мнение меня никто не забанит! Кроме того, никто не имеет право копировать материалы блога без использования ctrl+C/V!

© Copyright 2008