Роскомнадзор планирует заблокировать IP сайта t30p

На днях в РФ заблокировали сайт Спутника и Погрома. И Роскомнадзор нашел его копию в индексе t30p, которую удобно читать как sputnik.t30p.ru или sputnikpogrom.t30p.ru . А также напрямую в поиске t30p или напрямую в кэше. В общем, предлагается вычистить все 2400 статей, что муторно и лень, поэтому что делать пока не решил.

UPDATE: указанные сайты теперь редиректят в мой блог.


Метки: ,   


Топ трансляций Перископа в России

Создал раздел с популярными русскоязычными трансляциями перископа за сутки. Видео в итоге малова-то по количеству, возможно нужно громкое событие или смягчить условия попадания в топ. Но зато все трансляции достаточно показательны. Скажем прямой эфир из туалета или "бросил парень". И среди этого бардака некоторые СМИ пытаются устраивать новостные вставки: 


Метки: ,   Категории:t30p


Информационные аккаунты в Твиттере

У сайта t30p есть много интересных каналов информации, о существовании которых мало кто догадывается. Перечислю сокрытое от масс:

  1. Платные посты в ЖЖ, трансляция их в блоге promo.t30p.ru и в Твиттере @t30p_promo
  2. Топовые русскоязычные фотографии из Инстаграм можно удобно смотреть в Твиттере @t30p_instagram
  3. Видео-Трансляции на Ютубе, найденные в t30p собираются в @t30p_live
  4. Видео-Топ (популярные ролики Ютуба за день) транслируется в блог video.t30p.ru и Твиттер @t30p_video
  5. Видео с ютуба удаленные, но сохраненные в копии должны быть тут по Rss, но обычно их нет. Так как ситуация, чтобы кто-то загрузил и удалил видео, а сайт за это время успел сделать копию - редки.
  6. Топовые сообщения в фейсбук, которые удалось проидексировать (ибо это сложно), собираются в блоге facebook.t30p.ru и на аккаунте @t30p_facebook
  7. Топовые сообщения Вконтакте собираются в блоге vkontakte.t30p.ru и на аккаунте @t30p_vkontakte

Метки: ,   Категории:Twitter | news | t30p


Мобильное приложение t30p.ru в AppStore

После 3-х месячного перерыва в работе мобильного приложение наконец-то удалось его переопубликовать в AppStore. Перебой был вызван тем, что iOS9 принудительно блокирует http запросы, требуя по умолчанию HTTPS. Всем, кому интересно развивать социальный гео-поиск, ставьте приложение по ссылке, тестируйте и делитесь отзывами. Может у кого будут еще идеи для релизации.


Метки: , ,   Категории:Apple | t30p


О текущих проблемах

Осень "доставляет" проблемы. Текущий список выглядит следующим образом:

  1. Закончился 3-х летний период BizSpark для t30p.ru. Поэтому расходы возрастут на 10т.р. в месяц. Или может кто поделиться доступом к халявному Azure?
  2. Закрыт банк "Росинтербанк", в котором был счет юр.лица. Пара тысяч рублей и бухгалтерия погорела. Опять бессмысленная бумажная волокита.
  3. Не удается опубликовать обновленное приложение для iOS. Уже целый квартал, как приложение не работает под iOS9. Проблема в том, что iOS9 без предупреждения блокирут все HTTP запросы, требуя только HTTPS. Это можно было бы исправить новым приложением, но оно не публикуется из-за распространенной ошибки "0. 3.0 BEFORE YOU SUBMIT: ICLOUD" - то есть приложение копирует часть себя в iCloud. При этом указана настройка "не копироваться", но видимо последние версии xCode ее игнорируют. Некоторые считают, что это связано с иконками, но хз.
  4. Я до сих пор забанен на Facebook, поэтому даже число читателей тут заметно упало.

Итого. Новых выпусков на ютубе пока не ждите. И походу у читателей есть последний квартал, чтобы пожертвовать на t30p.ru, ибо есть основания полагать, что скоро этот сайт прекратит работу. Реквизиты, как всегда в профиле, хотя за 10 лет ими никто не воспользовался, но дублирую их тут - Пожертвовать деньги можно через PayPal или Яндекс.Деньги.

PS: также в понедельник умерла дальняя родственница баба Нина из Рассказово =(. 

 


Метки: ,   


Деление видео на мужские и женские каналы

Не так давно в видеотопе добавлено деление на мужские и женские каналы. Как показано на картинке. Как определяется пол видеоблогера? По информации, которую блогер указывает в своем привязанном GooglePlus аккаунте. К сожалению, многие блогеры не привязывают g+ к youtube или просто не указывают свой пол. В частности количество распознанных женских каналов раза в 3 меньше количества мужских. Поэтому призывают блогеров указывать в настройках GooglePlus свой пол или пишите мне напрямую комментарием, чтобы я у определенных каналов жестко привязывал их к мужской или женской тематики. Без заданного пола, каналу ютуба не будут попадать в указанные подразделы:


Метки: ,   Категории:t30p


Разное, проблемное.

Итак значит, обо всем и ни о чем:

  1. Youtube отклонил заявку на монетизацию моего канала "we are unable to accept your application because your channel does not contain sufficient original content." То есть контент на их взгляд не достаточно уникальный.
  2. Apple не дает мне обновлять приложение t30p в AppStore ссылаясь на показ user-generated content, требуя, чтобы был модератор и там прочие требования, которые нужно еще заморочиться выполнить. Тем, кто мне пишет, что перестает работать приложение - простая пере-установка должна помогать.
  3. Microsoft с 20 июля переходит на msvs2015, к ней должны работать ключи полученные через BizSpark, так что проблем не будет.
  4. С сентября Azure закрывает Azure SQL Business, переходят на другую тарифную сетку. Требуется перевести базу данных. Проблема в том, что сколько я не пытался переносить ранее - всегда возникали проблемы с производительностью. Скоро придется перейти в принудительном порядке. 



Метки: , ,   Категории:Apple | microsoft | t30p


Рейтинг блогосферы - пост 6 (жизнь поста в блогосфере)

Продолжаю рассказывать о том, как работает рейтинг постов блогов(он же topbot.ru) и публикую диаграмму, на которой я показываю важность фильтра постов, помещаемых в ТОП по темам дня. Основная мысль, которая демонстрируется в том, что в ТОП должны попадать те записи, которые не были в новостях или были написаны раньше новостей. Так как ТОП30 должен формировать новости, а не новости ТОП30. И только в такой постановке можно сделать топ30 гласом народа - местом для высказывания новых мыслей, а не тех, что были пропущены через спамеров и СМИ.

На диаграмме синим квадратиком обозначена наша экспертная система - топ30. Зеленые фигуры - это те посты в блогосфере, попадание которых в топ желательно. Красные - нежелательно. Желтым обозначены СМИ, которые не рассматриваются нашей экспертной системой, но которые влияют на наши входные данные. Почти все комментарии я написал на диаграмме, поэтому все остальное должно быть понятно.


Метки:   Категории:topbot


Рейтинг блогосферы - пост 5 (алгоритм сортировки)

За прошедшую неделю я успел пообщаться с нашим патентным ведомством, которое сказало мне, что алгоритмы не патентуют, патентуют готовые прототипы. Предложили подогнать мою заявку под "Программу для базы данных для ЭВМ", но я не стал тратить время. Таким образом продолжаю серию постов, кратко рассказывающих как формируется ТОП30. Содержание уже опубликованных заметок

Сегодня я приведу алгоритм первичной сортировки и объясню некоторые моменты. Если Вы читали предыдущие заметки, то должны знать, что алгоритм первичной сортировки нужен только для того, чтобы выбрать порядок в котором записи будут анализироваться на предмет прохождения через фильтры. Собственно сам package первичной сортировки:Далее...


Метки:   Категории:topbot | Yandex


Рейтинг блогосферы - пост 4 (про ссылки)

Примечательно, что с каким бы программистом я не начинал обсуждать алгоритм составления ТОПа, в итоге каждый говорил, что вот он сейчас пойдет создаст сайт, выложит там новый ТОП и станет популярным. Это с одной стороны хорошо, так как показывает, что программисты - люди дела и любители играть в разные алгоритмы, а также мечтают стать знаменитыми. Но с другой стороны показывает, что они не понимают
1) Как работать в команде,
2) Что так как все работают с одним векторным пространством и одинаковыми сырыми данными, то в итоге рейтинг у всех будет совпадать в значительной степени.(~20%)
3) Самая сложность не в первоначальной сортировке, а в последующих фильтрах, которые должны отсеять спамерские посты. А спамерские посты чаще всего имеют ссылки как входящие, на сам пост, так и исходящие - на рекламу - которые нужно уметь определять и фильтровать. Вот об этом алгоритме работы нового ТОПа и поговорим.

После 4х летнего изучения топов я с полной уверенностью могу сказать, что нет смысла составлять списки бана, то есть лишать определенныз определенных блогеров шанса попасть в ТОП. Ибо это равносильно тому, чтобы посадить своего модератора, так как спамер может создавать новые блоги каждый день. В связи с этим логичным видится
1) фильтр по ссылкам, которые содержаться в посте - то есть все ссылки должны проходить проверку через сервис opendns, чтобы исключить ссылки на фишинговые сайты в топе или на сайты с вирусами. Минус - медленная работа по отбору записей, поэтому я пока ограничился самосоставленным списком с плохими ресурсами. И если в после есть ссылка на плохой ресурс, то пост не попадет в топ. Также я расматриваю вариант, когда на наличие плохих ссылок будет анализироваться вся главная страница блога и страница профиля, так как вероятно их откроет человек захотевший узнать побольше об авторе ТОПа и этим тоже пользуются спамеры.
2) ссылки на популярные сервисы сокращения ссылок (bit.ly) можно пока не фильтровать, так как эти сервисы сами заинтересованы в фильтрации ссылок на фишинговые и вирусные сайты.
3) Ранее я упомянул фильтр на локальный экстримум - он заключается в том, что проверяется, что за локальный период времени ссылок именно на этот пост блогера было больше всего или комментариев было больше всего. Это прежде всего позволяет отфильтровать тех у кого есть трансляции и у кого стабильно по несколько ссылок между своими трансляциями. Также отфильтрует тех, у кого стабильно много комментариев, например из-за спама в комментариях.
4) Анализируя спамерскую активность я пришел к выводу в необходимости фильтра "LinksIntegrity" - задача которого проверить все ссылки на расматриваемый пост, отбросить одинаковые, отбросить те, которые сделаны из сообществ и отбросить все ссылки с микроблогов. Повышенная активность в микроблогах и то, что там почти каждый пост содержит ссылки - говорит о том, что нельзя микроблоги причислять к полноценным блогам. Кроме того в микроблогах сейчас каждый упоминание типа "@user" - считается ссылкой и это сильно перекосило рейтинг блогеров и вызывает недоумение в определенных кругах. Итак, после отбора ссылок, проверяется, что оставшееся число ссылок достаточно для того, чтобы интегральная характеристика поста оставалась среди 20% постов с наибольшим значением.


Метки:   Категории:Blogs | Analytics | topbot | Code


Ретинг блогосферы - пост 3

Провел небольшой эксперимент, имея на руках 4 параметра (visits24, links, comments, commenters), базу из 1000 постов за 3 дня, а также историю ТОПа с 40 постами за сутки, а попытался методом перебора коэффициентов найти наиболее подходящий вектор, на который делается проекция, как было описано в первом посте, чтобы после сортировки всех записей по величине этой проекции, в первых 100 оказывалось максимальное число постов, которые попали в топ, построенный по старому алгоритму. Результатом стал вектор (10,9,12,12) с результатом в 25 постов из 40. Это прежде всего говорит о том, что в текущем алгоритме есть явная завышенная зависимость от числа различных русскоязычных комментаторов к посту (commenters). Я же для сортировки записей беру вектор с равными весами = (1,1,1,1). Кроме того, стоит отметить два выявленных особенностей 1) В блогах на YaRu - внутренняя ссылка является также комментарием, поэтому важно уменьшать кисло комментариев на число ссылок. Иначе получается завышенное число ярушных блогов с высокими значениями. 2) Нормировка происходит не только в группах по типу блогплатформы, но и по типу блога или сообщества. То есть для блогов и сообществ максимумы значений считаются отдельно. После того, как записи в текущей куче постов за 3 дня отсортированы применяются фильтры. Их много, я их кратко перечислю по ходу применения: Далее...


Метки:   Категории:Code


Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner

Мои Твиты

Twitter ноября 15, 14:44
Сериал Into the Badlands по мотивам сказки Путешествие на запад http://dlvr.it/Q14jp3 https://twitter.com/f1ashr/status/930808635369721858/photo/1

Twitter ноября 11, 07:54
Telerik AppBuilder закрывается http://dlvr.it/Q0MtYQ

Twitter октября 31, 09:39
Схема происходящего в России http://dlvr.it/PyT5Ct https://twitter.com/f1ashr/status/925296063606546432/photo/1

Twitter октября 28, 05:53
Проблема монетизации на Ютубе http://dlvr.it/Py01hT https://twitter.com/f1ashr/status/924152017450295296/photo/1

Twitter октября 27, 15:18
От диалектики Гегеля до криптовалюты и криторубля http://dlvr.it/Pxtypc https://twitter.com/f1ashr/status/923931841089826816/photo/1

Twitter октября 20, 01:26
Beep-Beep Im a Sheep (go crazy now) http://dlvr.it/Pwcn4M https://twitter.com/f1ashr/status/921185716796760065/photo/1

Twitter октября 19, 11:48
Что американские военные забыли у берегов КНДР? http://dlvr.it/PwW4hN https://twitter.com/f1ashr/status/920980032536788993/photo/1

Twitter октября 19, 00:58
По случаю 8 марта погасили статую свободы http://dlvr.it/PwRD5W https://twitter.com/f1ashr/status/920816280277475328/photo/1

Twitter октября 18, 21:41
Разбор сериала "Молодой папа" (теория общего знания, часть 22) http://dlvr.it/PwQ2wY https://twitter.com/f1ashr/status/920766717420113920/photo/1

Twitter октября 18, 19:19
Разбор сериала "Мир Дикого Запада" http://dlvr.it/PwP3ls

Twitter октября 18, 18:45
Реклама Зомби-Апокалипсиса в Москве http://dlvr.it/PwNq0G https://twitter.com/f1ashr/status/920722540372180992/photo/1

Twitter октября 18, 18:13
Peace, Death! (Пиз Дец) http://dlvr.it/PwNY8d https://twitter.com/f1ashr/status/920714366315503616/photo/1

Twitter октября 18, 14:23
Бог благословил Китай на второй этап http://dlvr.it/PwLjnX

Twitter октября 18, 08:23
Про самолет Ту-154 и убийство посла http://dlvr.it/PwHw6C https://twitter.com/f1ashr/status/920566078681444354/photo/1

Twitter октября 18, 08:23
Фильм Ученик от МинКультуры http://dlvr.it/PwHw5p https://twitter.com/f1ashr/status/920566072800972800/photo/1

Twitter октября 17, 14:12
Британец прожил 3 дня козлом http://dlvr.it/Pw7r64 https://twitter.com/f1ashr/status/920291330399408128/photo/1

Twitter октября 17, 13:06
Рутин тутин Путин http://dlvr.it/Pw7B2f

Twitter октября 17, 10:53
Skype and Baidu links http://dlvr.it/Pw5xcN

Twitter октября 17, 10:21
TwitterFeed прощается с нами через 2 недели http://dlvr.it/Pw5fc2

Twitter октября 17, 09:49
Google публикует Новые правила в отношении согласия пользователей http://dlvr.it/Pw5M5t

Мой твиттер

Копирайт

Все мысли, высказанные в блоге, являются моим мнением и за это мнение меня никто не забанит! Кроме того, никто не имеет право копировать материалы блога без использования ctrl+C/V!

© Copyright 2008