The Internet could crash

Последнее выступление на популярной полунаучной TED было посвящено Интернету, что до сих пор никто не знает, что делать, если он вдруг перестанет работать. А это со слов докладчика может произойти. В остальном выступление скучное, но пусть будет и у меня в блоге.


Метки:   Категории:Semantic Web | trend


Humans.TXT

Интересная инициатива стандартизации описания людей, который разрабатывали тот или иной интернет проект - Humans.TXT, по аналогии с robots.txt, только не для роботов, а про людей. В целом нет особого смысла в добавлении дополнительной link type="text/plain" в шапку сайта, так как от этого сайт только увеличится.

Метки:   Категории:Semantic Web


CloudSearch

Сегодня Амазон объявил о выходе нового продукта - поисковик в облаке. То есть все то, о чем можно мечтать при обработке больших объемов данных. Есть интерфейс стоп слов , управление полями индексирования и т.п. Пугает лишь то, что за это придется платить и так как сервис новый, то стоит ожидать крупных сбоев. По цене все предлагается за от $0.12 per hour, что есть 1 инстанс и меньше 100у.е. в месяц. На базе cloudsearch уже проиндексировали Википедию, правда только англоязычную. Русский язык там не работает. В любом случае это мощная заявка на то, чтобы подвинуть другие корпоративные решения по контекстному поиску, который в перспективе станет мощнее яндексовского.

Что касается Azure, то для него пока нет решения из коробки в виде отдельного поискового сервиса, однако есть библиотека Lucene, которая позволяет индексировать и искать документы в облаке, хранить индекс будет в storageblob, но настраивать придется все самому. Но и тут нет морфологии. Если бы морфология поставлялась из коробки, а не приходилось бы прикручивать Lemmatizer, то это решение бы победило.

Метки: , ,   Категории:Semantic Web | trend | microsoft


Fake Media

Занятная статейка написанная на европейский грант про распространение искаженной информации в "новых медиа". По сути постулируется, что нужен "медиатор" - промежуточный агрегатор сообщений для проверки их трастовости. Об этом же нам говорит и общая теория семантического обмена информации (не постил ее, хотя собирался лекцию читать об этом), что между источником и получателем должен быть промежуточный медиатор (один из 9 инвариантов), который корректирует передаваемую информацию. По-русски его часто называют адаптером. Но возвращаясь к неидеальной текущей ситуации, когда люди продолжают приходить в интернет идет битва интерфейсов в попытке привлечь к своему интерфейсу как можно больше людей и при такой постановке задаче, никто о медиаторах не заботится - главное скорость поставки, что получается при передаче точка-точка.

Метки:   Категории:Semantic Web | Analytics


oEmbed - is there any future?

На довольно интересную спецификацию разработанную два года назад навел меня V.exeR и зовется она oEmbed. Задумка в том, чтобы позволить встраивать на страницу любой контент с другой страницы. Вроде бы умно, но есть несколько минусов, хорошо описанные тут.
1) Чем это лучше простой вставки через iframe?
2) Почему подразумевается всего-лишь одна вставка соответствующая одной странице?
3) Зачем нам oEmbed, когда есть XRDS от фицпатрика и web slices от микрософта?

И не смотря на это и то, что рабочая группа формата давно мертва (я подал заявку на вступление), oEmbed внедрен на youtube и flickr и в целом может еще убить все эти gavatar, pavatar и другие простые модели переносимых на сторонние ресурсы данных. В комментариях к формату можно почитать много разного, в том числе, что это "web2.0 epix fail". Но меня заинтересовало другое, что формат можно дополнить семантическим смыслом и на примере этих маленьких кусочков данных, которыми являются ответы oEmbed API, показать потенциал разумного обмена данными в интернете. Так что не так сейчас?
1) Одна страница - один ответ Embed API - это должно быть доработано до одна страница - один ответ API одного типа, то есть в endpoint вставки добавляется указание типа объекта. И все стандартные типы должны быть заданы, например "video", "image", "book" и т.д.
2) Добавляем в ответ RDF схему со смыслами тегов и разделяем данные, смыслы и отображение. Для видео с ютуба правильным будет ответ не в виде html тега с уже готовым кодом вставки - из-за этого как раз и возникает вопрос нужности oEmbed API с его дополнительным запросом к серверу. То есть добавляется ссылка на описание ожидаемых тэгов и их формальное значение, а также ссылка на xslt файл для формирования отображения.
Copy Source | Copy HTML
  1. <oe:oembed xmlns:oe="http://oembed.com/rdf/video" xmlns:xslt="http://oembed.com/xslt/video">
  2. <width>200</width><width>200</height><url>http://youtube.com/blabla</url><title>свежие сиськи</title>
  3. </oembed>
3) В браузерах должно быть сделано кэширование стандартных xslt схем отображения.
4) Все ресурсы по необходимости могут переопределить или дополнить формат отображения выдаваемых ими данных.

Вот такая вот упрощенная концепция семантического веба, вот такое вот возможное будущее.

Метки:   Категории:Semantic Web | trend


Social News

Рядом интересных социальных новостей ознаменовался понедельник. Они по большей части печальные, так же как и обвал сегодня рынка на 2%.
Итак, 1) ВКонтакте таки открыл API - причем полностью по идеологии Facebook, поэтому ожидать, что сеть станет более открытой не стоит. Также это означает, что интернет развивается в сторону тихой гавани - "закрытых сообществ", которая, как очевидно, должна развалиться, так как не соблюдает парадигму открытого web'a.
2) На выходных прошли Russian Startup Weekend/Challenge, отчеты о которых уже выложены в интернете, но даже авторы замечают, что ситуация в рунете оставляет желать лучшего.
3) Ning - строительство социальных сетей, сообщило, что заканчивает предоставление бесплатных возможностей. Мне всегда казалось, что это весьма мощная модель раздать всем продукт, а потом брать деньги за его поддержку и фишечки. Но видимо, либо владельцы социальных сетей не нуждаются в платных фишечках, либо строить социальные сети уже не можно и все ломанулись в Facebook.
4) И очередная загадка интернета - это оценка groupon в один миллиард долларов. Это проект, который позволяет людям объединится и дружно купить что-то со скидкой. Подобные модели объединения покупателей существуют давно и даже у нас в России есть прокупатор, где тоже есть возможность продажи по заказу. Но меня удручает то, что для того, чтобы просто купить товар мне нужно сделать кучу действий, собрать каких-то людей, чтобы оформить заказ, вместо того чтобы просто прийти и оплатить все это одной и той кредиткой, по которой бы и начислялась скидка и прочие "бонусы". Видимо я никогда не научусь пользоваться системами созданными для идиотов.

Метки: ,   Категории:Semantic Web | F*Connect | trend


Open Social 1.0

Вчера было опубликовано обновление для известного фреймворка по созданию приложений (и гаджетов) для социальных сетей - Open Social от гугла. Наконец-то версия проекта достигла 1.0. Примечательно, что несмотря на 10 тыс. подписчиков этого сообщения отзывов об этом событии почти нет, даже на популярных технических ресурсах. Это еще раз подчеркивает тот факт, что приложения для социальных сетей чаще создаются компанией натренировавшихся разбираться во всем этом ужасе, а не отдельными людьми. И вот первые не станут особо обсуждать нововведения в фреймворке, пока клиента устраивает все то, что можно было делать на старой документации.

Я пробежался по основным моментам технической документации (которая описывает непривычным мне REST для JS) и тоже не увидел ничего сверхнового. Особо уделил внимание Social API Server, который развивает приезжавший в Москву Крис Чабот. Как вижу, парадигма у него с тех пор не поменялась. Основной упор делается на треугольник "Профиль-Связи-Активность". И большинство изменений заключаются в том, что добавляются новые медиа данные в загрузке и выгрузке активностей. Я же не раз упоминал, что давно пора расширить парадигму до "Профиль-Связи-Активность-Статистика-Состояние". Статистика - это понятно. Состояние подразумевает то, что у любого социально значимого объекта есть статусы характеризующие его состояние принимать или выдавать информацию. Что касается человека, то для него давно известны следующие статусы - Online, Offline, NA, DND, Baned, Dead. Последний статус говорит о том, что у виртуального носителя нет живого представителя. И пожалуй к этому разработчики парадигмы еще придут лет так это через 20.

А пока фреймворк от гугла медленно теряет популярность мы слышим о попытках Твиттера сделать ход конем и создать что-то глобальное, объединив всех пользователей с открытых платформ, но пока не ясно как именно.

Метки:   Категории:Semantic Web | Google


icom - part 1

Вернулся с icom, в целом все прошло планово, как и ожидалось много бесполезного про твиттер и каждый рекламирует свою кампанию или продукт. Особо не понравилось, что в выданных брошюрах, организаторами допущено много опечаток и слово блогер написано с двуся Г. А вот Яндекс, что был виден через окна конференции, вывесил несколько плакатов, где это слово написал правильно. Всегда верил, что в Яндексе есть грамотные люди.

На конфе же из умных людей отметил для себя Tuganbaev'a и Тарлитку. Несколько смешных моментов:
Тарлит: -Если вы хотите сделать закон об интернете, то может закон и о воздухе сделаете?
Shegel: -Вы недооцениваете Думу, закон о воздухе давно существует!

Про твиттер: "У вас 3 тыс. последователей? Да какой Вы масфолловер?! Вы обыкновенный рукоблуд! Автоматизироваться надо! "

Разработчик проложения для вконтакте: -Раньше я жил в Рио-Да-Жанейро, купался в море, а потом решил создать приложение для Вконтакта и теперь я в Москве ...
Остальное завтра, в том числе и ссылка на мою презентацию, когда обновится сайт с номинантами на премию блог рунета. Там вроде опять каких-то заштопиков наградили.
----
А пока срочное сообщение:

Недавно открывшийся и рекламировавшийся на хабре проект по распространению информацию о семантическом интернете нуждается в вашей помощи. Человек занимающийся поддержкой ресурса и сбора информации о семантическом Интернете опубликовал объявление, где пишет, что нуждается в деньгах. В общем кому его ресурс видится полезным и есть желание, чтобы собранная информация не потерялась - прошу по ссылке. Лично я не сторонник благотворительности по интернету и ничего не перечислил, однако верю, что такие люди в интернете существуют, ибо ресурс действительно уникальный для рунета.

Метки:   Категории:Semantic Web | Yandex


Околонаучные новости.

Сегодняшним постом выскажусь о трех недавних работах, которые можно считать попытками сделать в блогосферке, да и в интернете, что-то научное.
Во-первых, это новость про алгоритм определения влиятельных блогеров для наилучшего распространения информации, его даже на ленту перепечатывали. Удивительно, но реализации у этой методики нет, так как для этого алгоритма потребуется знать все ребра и вершины социального графа в конечный момент времени, а это уже есть утопия. Также почти все социальные сети не позволят Вам беспрепятственно извлекать информацию о связях (ребрах) социального графа. Авторы гордятся доказательством того, что блогеры с большим числом друзей, не всегда самые влиятельные. Но на практике, когда ретрансляция рекламного поста быстро затухает рекламодатель прежде всего заинтересован в размещении рекламы у тех блогеров, аудитория которых не пересекается и максимальна. То есть просто сортируются все блогеры по стоимости контакта и ищутся те, кто согласится размещать материал. Мой вывод, что алгоритм ранжирования на яндексе (за исключением ранжирования твиттера, ибо каждый ответ приравнивать к ссылке - это идиотизм) куда более жизненный и демонстрирует кластерную обработку поступающей информации, нежели предложенный в работе.

Вторая работа является кандидатской РАН на точно такую же тему - определение точек вброса информации в социальную сеть. Правда в отличии от первой работы автор не ограничивает себя во времени и строит сети Маркова на N мерном графе, которые могут сходиться к заданному значению бесконечно долго. Работа опять страдает вышеперечисленным, что считается известным все и вся в графе. Абсурд дополняется тем, что считается, что точки вброса информации со временем могут менять транслируемое мнение и то, что все участники сети с одинаковой степенью впитывают чужеродную информацию и к любому участнику сети мы можем приложить управляющий вектор. Пользы от такого тоже мало.

И в заключение, новость о запуске HotLog'om статистику статистик по сайтам рунета, по аналогии с той, что уже два года работает у меня на ljmap.info и обрабатывает больше источников включая зарубежные. По опыту, отмечу удобство нахождения данных по произвольному сайту, для которого хочется найти данные, но заработать на этом невозможно. Если брать научную составляющую, то подобный сервис является из разряда 8го инварианта семантического интернета - Monitoring, то есть сбор воедино распределенных статистик(5х инвариантов - Combine). Прозрачность получения данных и общедоступность таких ресурсов позволяет говорить об их полезности для интернета в целом.

Метки:   Категории:Blogs | Semantic Web


Social Media Monitor

Очень интересный проект, посвященный мониторингу социалки появился под крылом Микрософта - ViralHeat. Все выглядит просто и красиво, я и сам мечтаю когда-нить нечто подобное сделать. Вы вводите бренды, а оно вам строит графики на подобии "пульса блогосферы". Самая важная разница в том, что проект сконцентрировался на микроблогах, простых сайтах и видеохастингах, то есть отбросив популярные блогохостинги, а может просто не успели добавить. Ниже видео с кратким экскурсом по сайту: Вся незадача в том, что стоит такое удовольствие 10у.е. в месяц. Лично я, не стал бы платить за какой-то там график по социалке, с которым потом не понятно что делать - "то ли он случайно таким получился, толи дейстительно была эффективной реклама бренда".

Метки:   Категории:Semantic Web | trend | microsoft


Идентификая по мылу.

Микрософт вложил 6,5млн.у.е. в разработку проекта, позволяющего формировать распределенный идентификатор по мылу пользователя. Эх, а ведь почти год назад я создал прототип такого же проекта и пытался впарить его российским венчурам, но натолкнулся на фразу "нет монетизации" =(. Не сказал бы, что за год появились хоть у кого-то идеи как правильно монетизировать пользовательские профили, однако, как всем стало очевидно, без них нам не завершить строительство Семантического веба.

Метки:   Категории:MailID | Semantic Web | idea


Holywar: Semantic Web (+ web 3.0)

Забавное письмо пришло от imhonet.net (рекомендательный сервис), в котором они пишут, что уже создали "Веб 3.0" и приглашают присоединиться. Я конечно не могу сердиться на неучей за использование разных слов, но считаю своим долгом в очередной раз попытаться просвятить людей о том, что же за сервис они создали.

Во-первых, я отрицаю существование слова "веб *.0", есть только "web 2.0", введенный Tim O'Reilly для обозначения новых возможностей, которые дал нам Интернет на сегодняшний момент. Под новыми возможностями понимается, что каждое сообщение надстраивается мета информацией об отправителе и получателе - internet identity layer - или социальный профиль.

Во-вторых, все эти "web *.0" - это лохотронство, ориентированное на публику. На самом же деле есть либо SemanticWeb, либо незавершенный SemanticWeb. И чтобы построить 1 SemanticWeb нужно 8 инвариантов, при условии, что все люди имеют заранее определенное одинаковое представление о вещах. В противном случае нам нужен 9й инвариант в виде онтологического описания всех наших сообщений и тогда можно говорить, что мы создали несколько SemanticWeb, каждый из которых покрывает свою область знаний. Вот этот пост не имеет онтогогической надстройки, поэтому если Вы не "гик", как я, то и не поймете, о чем это я тут пишу.

В третьих, на прошедшем киборифе в секции "Web 3.0" много говорилось про сервисы предварительного заказа чего-то (типа, Прокупатор), как будущее Интернета, и про "персонизированные данные". Поэтому ниже я привел картинку показывающую, какие именно инварианты реализуют авторы рекомендательных сервисов. Зеленый цвет означает, что инвариант готов, желтый, что отчасти, красный, что ничего нет. (Что это за инварианты и почему так - читайте теорию либо задавайте вопросы лично)

Комментарий к таблице: Видим, что web 2.0 не завершен, так как всю пользу от использования персонизированных данных, мы еще не получили. Имхонет, как видим, добавил лишь кобинирование данных поверх незавершенного слоя идентификации. Всю их радость от того, что пользователи ставят оценки и из этого извлекается еще информация - я не разделяю. Покупатору же пофиг на пользователя, он занимается преобразованием сообщения от покупателя, на профиль которого ему наплевать, в предложение о покупке, создаваемое с использованием синергии продавцов, на пофили которых тоже игнорируются по большей части. И последнее, в список включен проект pubsubhubbub, расшифровывается как Publish Subscribe Hub Bubs(сиськи?) - новый проект от создателя ЖЖ, целью которого станет создание правильной, с семантической точки зрения, системы распределения контента (улучшение текущих агрегаторов) и наложения поверх нее распределенной системы мониторинга. Вообщем, радует меня Фицпатрик тем, что умеет создавать правильные с научной точки зрения проекты и получать за них большие бабки.
И шуточная картинка:

Метки:   Категории:Semantic Web | Analytics | trend


Blogs: Current State

Вот и завершился год, многое было сделано для развития интернета, но пожалуй самое важное, что из-за кризиса в новом году остануться лишь наиболее перспективные направления развития. (На меня же до сих пор давят, чтобы я выработал некоторые из них, ну да ладно, что-нить придумаю.)

А пока давайте взглянем, как выглядит наша блогосфера на конец года. Для это я нарисовал маленькую схемку, с общим посылом "Место аналитики в блогосфере". См. прик. vsd файл.

Метки:   Категории:Semantic Web | Analytics | trend


Без названия

1) Узнал, что через неделю 25го числа будет празднование 14-летия Российского Интернета. Ссылку не даю, так как не вижу смысла там присудствовать. Программа мероприятия обещает быть "увесилительной" - там разные группы будут выступать и т.д. Кого-то наградят за вклад в развитие интернета.

2) Забавная ситуация сейчас происходит с FaceBook'ом. Давно они внедрили систему, где каждый может разработывать приложения для блогеров взаимодействуя с другими пользователями блогохостинга, типа OpenSocial API. Напомню, что подобное есть на LiRu и на Mail.ru. Так вот, вся проблема OpenSocial API в том, что непонятны стимулы для программиста сидеть и тратить свое время, чтобы написать очередной тетрис. Только призрачная надежда, что его приложение пройдет модерацию и станет популярным среди многомиллионной аудитории. При этом модерация, которая могла заметить, что программист как-то пытается заработать на блогерах - скорее всего отклоняла приложение.

А теперь Facebook ввел понятие VerifiedApp - типа, если приложение прошло проверку и признано хорошим, то программсит может заплатить 400у.е. и поместить это приложение в специальный каталог приложений, который будет подсовываться всем поьзователям социальной сети как рекомендованый. При этом эти 400у.е. нужно будет платить каждый год. То есть получается очередная обдираловка с тех, кто еще и пользу приносит социальной сети нахаляву, иными словами в лучших традициях однокласников.

В заключение, сейчас у FaceBook'a 40000 приложений прошедших проверку. Предположим, что примерно 5% авторов заплатит, то есть это еще 800тыс. у.е. в год. Неплохая сумма, чтобы "отбивать" инвестиции.

Метки:   Категории:Semantic Web | trend | life


Википедия:Пожертвования - Википедия

Примерно 20 месяцев назад Википедия собирала пожертвования и собрала их в размере 1 млн. долларов.

Недавно они запустили очередной сбор пожертвований в размере 6 млн. долларов. На что пойдут эти деньги сказать трудно, но я не вижу объективных причин для столь возросших затрат, кроме как желания инвесторов отбить побольше денег во время экономического кризиса. Я думаю на такой модели они смогут достаточно долго еще зарабатывать и это только будет стимулировать к появлению "копий" этого популярного ресурса. А чем больше копий, тем больше энтропии в интернете, тем меньше пользы от конкретного ресурса.

ЗЫ: Пожертвовать деньги можно тут

Метки:   Категории:Semantic Web


Кто я?

Программист. Я слежу за блогосферой и знаю, как будет развиваться интернет. Когда у меня есть время я даже прилагаю для этого усилия. Подробнее

Последние комментарии

Не отображать

Topbot at FeedsBurner