Дороги и перекрестки...

Домой
От гиперкниги...
МПСС
Контакты

... истории Интернета
Григорий Громов

Предыстория | Дорога первая | Дорога вторая | Next | Дорога третья |  Статистика Интернета | Итоги и прогнозы | Эпилог и пролог

От гиперкниги к гипермозгу: Информационные технологии эпохи Интернета. Эссе, диалоги, очерки

Статистика Интернета: темпы роста, структурные изменения, числовые характеристики развития

 

Мы вовсе не предполагаем, что неточное описание следует предпочитать точному, мы лишь хотим сказать, что если описываемые факты не точны или наше знание о них не полно, то предпочтительней иметь точное описание степени их неточности.

Ф. Джордж. Конструкция мозга 

Первый вопрос обычно бывает самый простой: сколько людей в мире уже приобщились к различным формам относительно регулярного использования Интернета?

По состоянию на начало 2003 г. общее число пользователей Интернет в мире оценивалось на уровне 600 млн человек.

Ниже приводится несколько более детальный ответ на этот вопрос по годам – от 2001 и ранее, а также их соотношение по континентам.

Таблица 1. Динамика роста числа пользователей Интернета

Дата

Число пользователей, млн. Процент всего населения Земли Источник
Август 2001 г. 513,41 8,46 Nua Ltd
Август 2000 г. 368,54 6,07 Nua Ltd
Август 1999 г. 195,19 4,64 Nua Ltd
Сентябрь 1998 г. 147 3,6 Nua Ltd
Ноябрь 1997 г. 76 1,81 Reuters
Декабрь 1996 г. 36 0,88 IDC
Декабрь 1995 г. 16 0,39 IDC
Источник: Nua Internet Surveys

Таблица 2. Распределение числа пользователей Интернета по географическим континентам в 2001 г.

В мире всего 600 млн.
Африка 6 млн.
Азиатско-Тихоокеанский регион 190 млн.
Европа 190 млн.
Ближний Восток 5 млн.
Канада и США 180 млн.
Латинская Америка 30 млн.
Источник: Nua Internet Surveys

Таблица 3. История Сети на карте Статистики

Дата Количество
хостов доменов* Web-сайтов WHR, %**
Июль 2001 126 000 000 30 000 000 28 200 000 22,0
Июль 1998 37 000 000 4 300 000 4 270 000 12,0
Июль 1997 19 540 000 1 301 000 1 200 000 6,2
Июль 1996 12 881 000 488 000 300 000 2,3
Июль 1995 6 642 000 120 000 25 000 0,4
Июль 1994 3 212 000 46 000 3 000 0,1
Июль 1993 1 776 000 26 000 150 0,01
Июль 1992 992 000 16 300 50 0,005
Июль 1989 130 000 3 900 -  
Июль 1981 210      
1969 4      
* Общее количество всех типов доменов (commercial - .com; некоммерческих организаций - .org; образование - .edu... etc.).

** The Websites to Hosts Ratio (WHR). WHR оценивает процент контент-активной части сетевого сообщества. Другими словами, WHR отражает то, какой процент людей, проводящих время в Интернете, делают попытки стать и сами тоже Web-авторами, создавая собственные Web-сайты. Это числовой показатель я (Г.Громов) ввел для оценки текущего уровня так называемой креативной температуры Web.

  © Григорий Громов, 1996-2002.
Источники цифровых данных: Network Wizards (US), Dr. A.D.Marshall, а также оценки
Netvalley

Ежедневно на WWW возникает около 1,5 млн. новых Web-страниц, но при этом 50% всего трафика идет на первую по посещаемости тысячу Web-сайтов.

Alexa Internet. InternetWorld online.
August 31, 1998. 10:08:46 EDT

...40 процентов общего Интернет-трафика либо начинается, либо заканчивается в Калифорнии.

Pacific Bell. December 1995.

...трафик в Интернете удваивается каждые 100 дней.

Frances Hong. Internet Capacity Major
Theme for 1999. Study, New-York
(Reuters), 6 December 1998.

Интернет-трафик вырос более чем на 100% в 2001 г.: с 48 PB/месяц до 100 PB/месяц.

Большинство пользователей – 84 %, согласно отчету Национальной телекоммуникационной и информационной администрации (National Telecommunications and Information Administration) "Нация-онлайн" (A Nation Online), февраль 2002 г., подключаются к Интернет для использования сервисов электронной почты или онлайновых бесед типа ICQ.

John Ryan. RHK, Inc. 2002.

Интернет-трафик для основных коммуникационных стволов (back -bone network) США (Интернет и телефонная связь, исключая местные телефонные звонки) по данным Лэри Робертса (Larry Roberts) показан на рис. 1.

© Larry Roberts

Рис. 1

Из рис 1. видно, что рост трафика обгоняет рост числа хостов (отношение трафик/хосты растет на 14% в год).

...уже больше сеансов передача данных, чем сеансов голосовой связи проходит ежедневно во внутренней сети British Telecommunications PLc... традиционные телефонные звонки заменяются электронной почтой...

Yahoo! News: Technology Headlines, 5 November 1998.

В таблице 3 основой для измерения физических масштабов сети Интернет выбрано было число хостов. Хост здесь означает доступный по уникальному его IP адресу компьютер, подключенный к Интернету.

Почему для оценки размеров сети избраны именно Хосты?

Потому что нет никаких других способов посчитать Интернет-население в целом: Никто не имеет гарантированно верного ключа к ответу на вопрос – сколько пользователей в Интернет, однако большинство людей согласится, что есть по крайней мере один пользователь на один хост.

Источники: Internet Domain Survey. The Nua Ltd. etc.

Согласно заключению автора нашумевшей в свое время статьи "Безответственная Интернет-статистика...", ... нет абсолютно никакого способа достоверно измерить какой-либо надежной статистикой рост Интернета. Как заметил об этом Джон Квартер-ман (John Quarterman) из MIDS:

Дело в том, что Интернет – это именно что принципиально распределенная среда уже по самой своей природе. Это ведь и есть его самая сильная из отличительных особенностей. Никто не контролирует развитие Интернета, а составляющие его отдельные фрагменты развиваются совершенно самостоятельно, взаимодействуя меж собой так, чтобы формировать из отдельных компьютеров и сетей нижнего уровня глобальную Сеть сетей, каковой, таким образом, оказывается Интернет. Так вот именно по той простой причине, что не существует единого центра управления, никто соответственно не знает все об Интернете.

Измерения в данном случае дополнительно затруднены тем обстоятельством, что некоторые сети нижнего уровня самостоятельно устанавливают различной степени ограничения для доступа к ним, а значит, и жестко препятствуют таким образом измерению их активности. Поэтому вместо измерений в Интернете возможны лишь разного рода опросы, обследования и оценки.

Иными словами, необходимо ясно понимать, что вся представленная здесь – и где бы то ни было еще – статистика Интернета основана на избранных их авторами оценках, допущениях и предположениях. И даже если все было случайно выбрано совершенно верно и методика оценки не грешит какими-либо искажениями, то... сама по себе скорость роста глобальной сети может меж сеансами таких измерений не-предсказуемо изменяться. Читал где-то (если Вы знаете, где я это видел, пожалуйста, сообщите мне) что есть только одно заключение, которое может быть выведено из столь неопределенных данных:

Интернет становится все бОльшим, и это происходит весьма быстро.

Robert Orenstein

"Интернет станет бОльшим...". Ну и что? Вы все еще верите, что больше значит лучше?

Таблица 4

Год Процент общественных школ США, подключенных к Интернету
1994 35
1996 65
Источник: Win Trees

"В опросе, проведенном в начале прошлого года (1996 г.), американские пре-подаватели оценили компьютерные навыки и медиатехнологии как более "необходимые", чем изучение европейской истории, биологии, химии и физики; чем обсуждение социальных проблем типа наркотиков и разрушения семей; чем изучение практических навыков работы и чем чтение современных американских авторов, таких, как Стейнбек и Хемингуэй или классиков – Платона и Шекспира.

...Начальная школа Kittridge в Лос-Анджелесе отменила свою программу по музыке в прошлом году, чтобы сэкономить необходимые средства и пригласить в школу "координатора по технологиям"... В Мэнсфилд, шт. Массачусетс школьные власти исключили из своих кадровых списков позиции преподавателей по искусству, музыке и... физкультуре, чтобы получить возможность истратить 333 тыс. долл. на компьютеры; в одной из школ Вирджинии комната для занятий искусством была переоборудована в компьютерную лабораторию.

(Горькая ирония такого рода ситуаций заключается в том, что с полдюжины если и не более того ранее выполненных исследований делался вывод о том, что именно музыкальные и вообще разного рода художественные классы помогают формировать в том числе даже и сам по себе физический размер мозга ребенка, и закладывают таким образом те физиологические даже предпосылки, которые необходимы для развития способностей детей к изучению языков, математики, науки и инженерных дисциплин. То есть дисциплины гуманитарного цикла делают все это куда как более эффективнее, чем работа ребенка за компьютером...)

The computer Delusion. Todd Oppenheimer.
The Atlantic Monthly. 1997.

Пределы точности оценок

При чтении любых – решительно любых – источников статистических данных вышерассматриваемого типа необходимо четко понимать принципиальную ошибочность того подхода, который демонстрируют, к примеру, авторы некторых из приведенных в начале этого раздела таблиц данных, оцениваемых с точностью 4–5 знаков. Нет, никогда не было и не может быть сколько-то надежных методик для получения такого уровня точности данных обсуждаемых процессов.

Приведем ниже в качестве иллюстрации того факта, что подобного рода игра в "точность оценок" возникла не случайно и ни в коей степени не является характерной для приведенных выше примеров, анализ данных о точности ежегодных прогнозов, выполненный около 20 лет назад для одного из самых тогда авторитетных в Америке (для экспертов компьютерных технологий) источников. Именно с этой целью мы помещаем здесь фрагмент из опубликованной 20 лет назад книги "Национальные информационные ресурсы"– чтобы еще раз подчеркнуть устойчивый во времени характер решительно всех совершаемых такого рода ошибок, типичных для каждого очередного этапа развития информационных технологий.

Ежегодный технико-экономический обзор журнала "Электроника" готовился редакцией осенью и включал следующие уровни прогнозных оценок: опорные, фактические данные, полученные аналитиками и отражающие сведения за предшествующий год (лаг прогноза 1); оценку ситуации на текущий год, т.е. год, когда составляется прогноз (лаг прогноза 0); прогноз на следующий год, т.е. на год публикации, так как номер журнала с прогнозом обычно выходит 1 января (лаг прогноза 1); прогноз на три года вперед (лаг прогноза 3).

Каждый такой прогноз содержит значительный объем цифровой информации, структурированной по номенклатуре изделий вычислительной техники и классам ЭВМ. По каждому показателю приводятся его опорное, фактическое значение за минувший год и три прогнозные оценки с лагом 0, 1 и 3. Каждая оценка дается с пятью значащими цифрами.

Естественно было задать вопрос – насколько точны эти оценки? Сколько из приводимых 5 значащих цифр заслуживают доверия? Получить ответ на этот вопрос оказывается не просто, так как сравнить данные прогноза, сделанного, например, 3 года назад, с фактическими данными за этот год (спустя 3 года), как правило, нельзя: авторы регулярно "тасуют" сами по себе показатели (т.е. заменяют их другими). В тех редких случаях, когда сравнение оказывается возможным, погрешность прогноза на 3 года вперед оказывается на уровне 480 % (прогноз по малым компьютерам не дороже 100 тыс. долл. на 1980 г.), а погрешность прогноза на год публикации на уровне 200 % (микрокомпьютеры как комплектующие изделия на 1978 г.) и т.д.

На рис. 3 приводятся данные расчета относительной ошибки текущего прогноза журнала "Электроника" по основному из публикуемых им показателей – суммарный объем продаж всей вычислительной техники на американском рынке (это сводный показатель, поэтому его нельзя "стасовать", заменив другими, но и погрешность его должна быть меньше, чем остальных, так как в нем суммируются все данные). Из рисунка видно, что погрешность прогноза на год публикации, как правило, не менее 10%, на 3 года вперед – в пределах 20–60 %.

Рис. 2. Относительная ошибка, %, ежегодного прогноза журнала «Электроника»в оценке объемов продаж изделий вычислительной техники в США. Штрихпунктирная линия – лаг прогноза 0 – оценка объема продаж на год, предшествующий году публикации прогноза; сплошная – лаг прогноза 1 – оценка на год публикации прогноза; пунктирная – лаг прогноза 3 – оценка прогноза на 3 года вперед. Рассчитано по: «Электроника», No No 1 за 1962–1983 гг.

Таким образом, в цифровых данных, свыше 20 лет приводившихся в прогнозах журнала "Электроника", из пяти значащих цифр в лучшем случае при оценках могли учитываться не более одной – первой цифры.

Здесь уместно сослаться на точку зрения Ф. Джорджа (автора нашумевшего научного бестселлера 50-х гг. "Конструкция мозга"): "Мы вовсе не предполагаем, что неточное описание следует предпочитать точному, мы лишь хотим сказать, что если описываемые факты не точны или наше знание о них не полно, то предпочтительней иметь точное описание степени их неточности". Мы все еще – как 20 лет назад – полагаем, что внешне столько простая и, казалось бы, самоочевидная точка зрения Ф. Джорджа остается крайне трудной к восприятию читателями, а главное многими авторами работ по исследованию тенденций развития информационных технологий, и именно поэтому вынесли ее в эпиграф данной главы. Н. Винер высказывался в таких случаях более резко, считая, что приписывать "неопределенным по самой своей сути величинам какую-то особую точность бесполезно и нечестно".


Г.Громов. Дороги и перекрестки истории Интернета

Предыстория | Дорога первая | Дорога вторая | Next | Дорога третья |  Статистика Интернета | Итоги и прогнозы | Эпилог и пролог

От гиперкниги к гипермозгу: Информационные технологии эпохи Интернета. Эссе, диалоги, очерки


От гиперкниги... • МПСС • Контакты

Последнее обновление: 21.01.2010.