Студенческий меридиан
Журнал для честолюбцев
Издается с мая 1924 года

Студенческий меридиан

Найти
Рубрики журнала
40 фактов alma mater vip-лекция абитура адреналин азбука для двоих актуально актуальный разговор акулы бизнеса акция анекдоты афиша беседа с ректором беседы о поэзии благотворительность боди-арт братья по разуму версия вечно молодая античность взгляд в будущее вопрос на засыпку встреча вузы online галерея главная тема год молодежи год семьи гражданская смена гранты дата дебют девушка с обложки день влюбленных диалог поколений для контроля толпы добрые вести естественный отбор живая классика загадка остается загадкой закон о молодежи звезда звезды здоровье идеал инженер года инициатива интернет-бум инфо инфонаука история рока каникулы коллеги компакт-обзор конкурс конспекты контакты креатив криминальные истории ликбез литературная кухня личность личность в истории личный опыт любовь и муза любопытно мастер-класс место встречи многоликая россия мой учитель молодая семья молодая, да ранняя молодежный проект молодой, да ранний молодые, да ранние монолог музей на заметку на заметку абитуриенту на злобу дня нарочно не придумаешь научные сферы наш сериал: за кулисами разведки наша музыка наши публикации наши учителя новости онлайн новости рока новые альбомы новый год НТТМ-2012 обложка общество равных возможностей отстояли москву официально память педотряд перекличка фестивалей письма о главном поп-корнер портрет посвящение в студенты посмотри постер поступок поход в театр поэзия праздник практика практикум пресс-тур приключения проблема прогулки по москве проза профи психологический практикум публицистика путешествие рассказ рассказики резонанс репортаж рсм-фестиваль с наступающим! салон самоуправление сенсация след в жизни со всего света событие советы первокурснику содержание номера социум социум спешите учиться спорт стань лидером страна читателей страницы жизни стройотряд студотряд судьба театр художника традиции тропинка тропинка в прошлое тусовка увлечение уроки выживания фестос фильмоскоп фитнес фотокласс фоторепортаж хранители чарт-топпер что новенького? шаг в будущее экскурс экспедиция эксперимент экспо-наука 2003 экстрим электронная москва электронный мир юбилей юридическая консультация юридический практикум язык нашего единства
Голосование
Редакционный совет

Ростовцев Юрий Алексеевич
Главный редактор издания

Репина Ирина Павловна
Генеральный директор издания


Святослав Бэлза, Юлия Казакова, Ольга Костина, Кирилл Молчанов, Тимур Прокопенко, Владимир Ситцев, Людмила Швецова, Кирилл Щитов, Валентин Юркин


Наши партнеры










Номер 07, 2011

СЕТЬ МЕДУЗЫ, ИЛИ ЗАКОНЫ ВЕБА

Новая наука пытается определить, на что похож этот невероятно многообразный «маленький мир», построенный из узлов и разгороженных сообществ: веб.

ЛЕКСИКА

Сеть: среда, составленная из узлов (физических лиц, машин, концепций), объединенных связями. Это гипертекстовые, электрические, близостные связи и т. д. В математике также говорят о «графах».

Интернет: физическая и логическая инфраструктура, позволяющая информации перемещаться от машины к машине. Она начала разворачиваться с 1969 года в США и развивается до сих пор.

Веб: одна из сетей, использующих инфраструктуру интернета. Она позволяет связать между собой страницы, выложенные на серверы. Программа-навигатор позволяет читать эти страницы и переходить от одной к другой. Другие сети – электронная почта, стационарный телефон интернета, протоколы обмена файлами – также используют интернет.

Для большинства из нас веб и интернет являются практическими способами общения пользователей с помощью ПК. И нет смысла разбираться в том, как функционируют сами сети. Но для специалистов по информатике и математиков эти инновации – удивительные объекты науки и потрясают тем, что помогли создать обширную сеть, хотя их творение постепенно ускользает из их рук!

На что же действительно похожи сети компьютеров и веб-страницы? Как меняется их структура? Как легко путешествовать по этим комплексам? Как действенно отыскать нужную информацию, в том числе и скрытую? Вот вопросы, которые ставит новая научная дисциплина – наука о вебе. Ее сторонники уже организуют международные конференции, создали свою дорожную карту, вдохновителем которой является Тим Бернерс-Ли, один из изобретателей веба. Этот 56-летний британец создал в 2006 году «Веб Сайенс Траст» в университете Саутгемптона – ассоциацию для развития этой науки. Усилия последних десяти лет уже принесли свои плоды.

Самый большой успех – создание поисковика «Гугл», который родился из работ по графам (математическое обозначение сетей). Наблюдая, как структурируется веб с помощью связей, образующихся между страницами, маленькие американские гении информатики Серджи Брин и Ларри Пейдж разработали в 1998 году свой отныне знаменитый алгоритм иерархизации ответов на запрос. Этот рецепт был более или менее основан на количестве связей, адресованных к одной странице.

Завтра следует пойти дальше и изобрести новые способы отыскания информации, «в частности, те, о существовании которых пока ничего неизвестно!» – восклицает Кристоф Приёр из Лаборатории алгоритмической информатики, основ и применения (Liafa) университета Пари-Дидро-Пари-VII. Ибо веб, соединив между собой цифровые документы, теперь связывает между собой физические лица через блоги и социальные сети (Фейсбук, Виадео, Линкедин…). Тут возникают новые взаимодействия и новые типы графов. Социологи уже готовы заниматься этой новой наукой: еще никогда у них не было в распоряжении такого количества данных!

Голова кругом

Чтобы лучше понять функционирование этих многочисленных сетей, исследователи сначала попытались определить их объем... И ответа у них пока нет! В 2000 году у Гугла в памяти хранился 1 миллиард страниц, а в 2005-м их стало 11,5 миллиардов... Головокружительная инфляция.

– Сегодня уже не стоит заниматься подсчетами. Каждая запись в блоге, каждое добавление в Фейсбук, каждый мини-текст в Твиттере... создает столько же веб-страниц. Всё индексировать невозможно, – подводит итог Алессио Синьорини из университета Иовы (США). В этой области конкуренция бьет все рекорды.

– Нам удалось индексировать 16 миллиардов веб-страниц, и в ближайшем будущем у нас их будет 30 миллиардов, – утверждает Франсуа Бурдонкль, сосоздатель французской фирмы «Экзалид» (Exalead), отныне собственности «Дассо Систем», которая разрабатывает свой поисковик. Что касается сайта worldwidewebsize.com – сайта добровольцев голландского университета Тилбург, который разработал метод оценки размаха веба, – он насчитывает около 40 миллиардов страниц, индексированных основными поисковиками (Яху, Бинг, Гугл и Аск).

И это только надводная часть айсберга! В действительности существует «глубокий» веб, недоступный классическим поисковикам, работающий на основе данных, чей объем в 1000 раз больше «видимой» части. Эта информация может быть справочниками имен, предприятий, патентов, а также книг, музыки, изображений, научных данных и т. д. Для доступа к ним прямой связи нет, но есть рамка, заполнение которой позволяет компьютеру отправиться на поиск документов, соответствующих запросу. Поисковый способ, недоступный классическим поисковикам, которые умеют лишь щелкать мышкой по связям. Предприятия вроде «Космикс» или «БрайтПланет», или университетские проекты, вроде «Диппип», уже разработали специализированные программы для некоторых областей, чтобы получать скрытую информацию, а это еще больше усложняет сеть. Работа только начинается.

Много-структура

Представление блогосферы: шары – блоги, линии – связи между разными блогами.

Еще одно неизвестное: не существует никакой карты, чтобы сориентироваться в многочисленных соединениях интернета! Каждый поставщик доступа, каждое предприятие или ассоциация обладают свободой добавления компьютера-стрелочника к сети, но с одним ограничением: соблюдение правил, обеспечивающих движение информации. Иными словами, сеть не имеет великого архитектора, который знает все чертежи и постоянно их обновляет. Известно только, что нет централизации с помощью одного компьютера, через который проходила бы вся информация; не существует также пирамиды, где компьютеры нижнего уровня посылали бы инструкции своим вышестоящим компьютерам для прохождения информации; но нет и полного хаоса.

Для разработки общепринятой идеи, Микалис Фалустсос, профессор университета Калифорнии (Беркли), предложил оригинальную модель – медузу. Сеть из каких-то 35 000 ПК, которые управляют компьютерами-стрелочниками интернета, и будет этой медузой. Она имеет голову, периферические слои и, наконец, множество щупалец, соединенных только с одним из этих слоев. Если точнее, голова насчитывает менее 1% машин и представляет группу, где каждый соединен с соседом. «Щупальца» составляют более трети компьютеров. Между этими двумя комплексами есть различные группы, «соединимость» которых с центром уменьшается.

– Это простая модель, которую можно нарисовать от руки и которая содержит множество особенностей сети: компактный центр, небольшой диаметр, множество одиночных узлов, – подводит итог Микалис Фалустос.

Но модель не одна! У каждого свое представление в зависимости от нужд. Можно запускать узлы и связи случайным образом, чтобы создать сеть. Можно также извлечь отдельную реальную часть сети и работать с образцами. Можно создать путем повторов сеть с добавлением связей с особыми качествами. Обладание идеей «чертежа» позволяет избежать возможных «запоров» информации или находить слабые места. Это очень важно для тестирования более действенных протоколов до их опробования в истинной сети. В частности, чтобы проверить, работают ли они в широком масштабе.

Маленький мир

Одно ясно: веб не так велик, как кажется. Его объем с математической точки зрения может определяться, как кратчайший путь между двумя весьма удаленными узлами. Удивляет, что по меньшей мере 20 щелчками мышки можно добраться до любого узла сети! Это эквивалент – в виртуальности – того, о чем говорил социолог Стенли Милграм в 1967 году и что происходит в реальной жизни: он действительно показал, что шести контактов достаточно, чтобы получить адрес любого человека, которому вы хотите написать, даже если речь идет о президенте США. Американские исследователи Дункан Уоттс и Стивен Строгац из университета Корнелл обнаружили этот «маленький мир» в 1998 году во множестве отличающихся друг от друга сетей: например, сеть нейронов червей Caenor-habditis elegans, сеть электрических кабелей на территории Америки или сеть сотрудничества между актерами американского кино...

В 2000 году Альбер-Ласло Барабази из университета Север-Восток (Бостон) констатировал ту же ситуацию для веба и обнаружил последовательность 19 щелчков мышки. Йон Клейнберг из университете Корнелл в том же году детально описал эффективный метод транспортировки информации пакетами, доказав, что можно отыскать путь даже при отсутствии знания глобальной среды.

Законы здесь иные

Еще один удивительный эффект этих сетей, подмеченный Альбером-Ласло Барабази: законы статистики здесь иные, чем те, к которым мы привыкли. Сколько связей в среднем имеет одна веб-страница? В этом мире вопрос попросту не имеет смысла! Некоторые страницы имеют больше связей с другими страницами – и ведут себя как сайт-портал, а у других мало выходных связей по образу коммерческого сайта, который хочет сохранить для себя интернавт-пленник. Невозможно сказать, какова средняя величина в терминах связей одной страницы. Действительно, статистическое распределение связей, направленных к некоему узлу, представляет собой не кривую-«колокол», как школьные отметки в классе, где средняя величина имеет смысл. В мире веба говорят о законе степени. Многие узлы могут иметь многочисленные связи, и это число медленно уменьшается, тогда как оно стремительно движется к нулю в кривой-колоколе...

Это удивительное качество стало одним из критериев для проверки действенности модели сети. Для утверждения она должна приводить к законам степени. Нанося смертельный удар по столь простому понятию средней величины, эта констатация имела эффект взорвавшейся бомбы в момент открытия в 1999 году, и все дисциплины, работающие над сетями (генетика, нейронауки и т. д.), стали широко применять законы степени. Но реальность зачастую сложнее. Биолог Эвелин Фокс Келлер написала в 2005 году, что в биологии это «мало помогает в понимании скрытых явлений. Слишком многие различные механизмы могут приводить к подобным поведениям».

Эффект разграничения

Если мир веба мал, он еще и сильно разграничен. В сетях каждый связан со своими «друзьями» или с «друзьями друзей», но не больше. Кристоф Приёр и Стефан Ро из «Лаифа» изучали структуру социальной сети обмена фотографиями Фликр.

– В 76% случаев комментарии по фотографии принадлежат тому, с кем уже было взаимодействие. В 17% случаев пользователь находится в двух щелчках мышки от комментатора, – подводит итог Кристоф Приёр.

Иными словами, уходят из «дома» всего в 7% случаев... Это подтверждает более общий эффект, который уже наблюдали пионеры веба: сеть сформирована из «агрегатов», которые мило называются «сообществами». Каждый из этих комплексов имеет множество связей со своими и очень мало связан с соседними группами. И поэтому создает новые критерии для классификации различных узлов сети. Традиционно поисковики проводят иерархизацию, считая количество связей, направленных к некому сайту. Так можно определить различные критерии, которые выделяют «центральный» характер узла в сети (то, что можно рассчитать из подсчета комплекса возможных путей между узлами). Если он исчезает, соединимость комплекса сильно падает.

Подвижная сеть

Все движется во вселенной по имени Интернет! Пути от одного компьютера к другому при передаче пакетов информации постоянно меняются. Для лучшего понимания динамики лабораторией информатики университета Пари-VI был разработан «радар». Он наблюдает за «стрелочниками» интернета – десятками тысяч компьютеров, которые позволяют информации перемещаться. Продолжающийся анализ показывает, что эти пути не стабильны, а изменения происходят чаще ожидаемого.

– За неделю мы «видели» появление более тысячи машин, которых не было среди более чем 29 000 компьютеров во время первых семи недель нашего исследования, – свидетельствует Клеманс Маньен.

Еще один сюрприз: Йон Клейнберг показал в 2005 году, что сеть действительно растет, увеличивая количество узлов и связей, но не только. Регионы, богатые связями, притягивают новых участников. Так сеть становится плотнее, как в случае, если звезды рождаются в галактиках, а не между галактиками. Кроме того, расстояние, которое разделяет два удаленных узла глобальной сети, не увеличивается! Оно даже может уменьшаться, если верить расчетам исследователя. Если наш мир расширяется, то мир веба сужается...

Распределение роста людей в населении (или отметок в классе) следует хорошо известному закону статистики: кривая-колокол, кривая Гаусса. Она показывает вероятность попасть на человека ростом Х. Следствие: большое количество людей имеют примерно средний рост, но мало карликов или гигантов.
В мире сетей все по-иному. Вероятность найти узел с малым количеством связей очень велика. Сразу можно сказать: 20% узлов сосредотачивают 80% связей. Другой эффект, долгий поиск. Эта вероятность снижается с количеством связей, а потому можно всегда попасть на «гиганта».


Система уязвима

Рано или поздно будут сбои или смешанные атаки, которые повредят сеть сетей интернета. Как в ядерной отрасли, многие отказываются верить, что подобная катастрофа может произойти. Но к ней надо готовиться. Мы знаем, что у сети есть слабые места – в частности, уязвимость протоколов обмена. Нас занимают и связи крупных континентальных комплексов. Более того, раньше мы могли более или менее доверять участникам сети. Но с умножением участников и развертывания интернета в планетарную сеть нет уверенности в поддержании доверия.

Еще одна проблема кроется в ожидаемом насыщении беспроводных сетей. Надо придумать новые протоколы вместо нынешнего, основанного на IP (адресе и имени компьютера), чтобы совместить фиксированные и мобильные сети. Надо также понимать, что Интернет – всего лишь кусочек пазла, который строится в большом масштабе. Завтра мы подключим датчики, объекты, роботов, людей (через сети геолокализации, которые станут стратегическими). Надо радикально перестроить интернет для диверсификации обслуживания, более прозрачного управления и безопасности пользователей, а не только стремиться к его улучшению.

Подготовила Анастасия ГРИГОРЬЕВА

 


К началу ^

Свежий номер
Свежий номер
Предыдущий номер
Предыдущий номер
Выбрать из архива