|
Объем хранимой информации на планете Земля за двадцать лет увеличился примерно в сто раз, и, согласно подсчетам ученых, в 2007 году он составлял 295 эксабайт (295 миллиардов гигабайт).
Журнал Science опубликовал результаты исследования Мартина Гилберта (Университет Южной Калифорнии) и Присциллы Лопес (Открытый Университет Каталонии), подсчитавших информационную емкость человеческой цивилизации. Целью работы было определить совокупный объем информации, доступной для искусственного хранения, передачи и обработки, то есть подсчитывались все, по возможности, учтенные и находящиеся в обороте данные, представленные в машиночитаемом виде. Заметим, что это очень важное ограничение, выводящее за скобки большой объем «немашинной» информации, представленной в виде прямых вербальных коммуникаций, а также мыслительной деятельности и биологической активности, совершаемых нами без участия искусственно созданных устройств и технологий.
С созданием искусственного интеллекта и техник, свободно манипулирующих геномом, это ограничение будет, возможно, снято.
Анализу подверглись 21 аналоговая и 39 цифровых технологий за период с 1986 по 2007 год. Эта выборка существенно превышает предыдущие (в частности, выборку компании EDC, сделавшей сходное исследование три года назад), и на данный момент ее можно считать самой полной. Для корректного подсчета совокупный объем информации был поделен на три группы: хранимая информация (учитывается емкость всех известных устройств хранения), передаваемая (емкость всех типов одно- и двунаправленных трансляций) и трансформируемая (емкость вычислительных процессов). Границы между технологиями иногда размыты, и такие тонкости тоже принимались в расчет. Простой пример - оперативная память RAM. Устройство запоминающее, но на самом деле оно является частью вычислительного процесса, поэтому отнесено к третьей группе.
Более сложный случай - технология печатных СМИ (газеты и журналы), которые участвуют как в передаче информации на значительные расстояния, так и в ее хранении на бумажных носителях. Вклад «газетных» мегабайт учитывался в обеих группах.
Широту охвата технологий и устройств можно оценить в специальном приложении к статье, где перечислены данные по информационному вкладу даже таких карликов, как калькуляторы, или более экзотичных случаев, например - рентгенографии. Под учет попали и игровые консоли, и виниловые пластинки, и цифро-аналоговые преобразователи, и промышленные микроконтроллеры, не говоря уже о книгах, аналоговом радио и даже традиционной почте.
Неучтенной, пожалуй, оказалась лишь система дорожных знаков, пиктографическая информация в общественных местах, тексты Брайля, деревянные счеты, маркировки на устройствах машино-человеческого интерфейса или устройства, основанные на троичной логике, но в такие дебри авторы решили не углубляться, да и надежной статистики по ним нет.
Согласно авторам публикации в Science, объем хранимой информации за двадцать лет увеличился на планете Земля примерно в сто раз - с 2,6 эксабайт (эксабайт - миллиард гигабайт) в 1986 году до 295 эксабайт в 2007-м.
Если посчитать этот объем информации в компакт-дисках, то в 1986 году понадобилось меньше, чем одна болванка на человека, в 1993 - четыре CD на одного человека, 12 - в 2002-м и, наконец, целый 61 диск пришелся бы на жителя Земли в 2007-м.
Стопка таких болванок покроет расстояние на четверть большее, чем от Земли до Луны, а чтобы скопировать ее потребовалось бы примерно 295 миллионов терабайтных винчестеров, или 295 миллиардов гигабайтных флэшек.
При этом доля цифровых способов хранения (25%) еще уступала аналоговым в 2000 году, а резкий перелом произошел лишь в 2002-м, что можно считать официальной точкой отсчета цифровой революции. Так, через пять лет на долю цифры приходилось уже 94% хранимой информации. На долю бумажных носителей в 2007-м осталось 0,007% (0,33% в 1986-м, когда большая часть байт тоже пожиралась мультимедиа - кассетами VHS, виниловыми пластинками и аудиокассетами), хотя в общей сложности объем бумажной памяти увеличился в два раза с 8,7 до 19,4 петабайт (то есть вся бумажная информация уложилась бы в 2007 году на 20 тысячах терабайтных дисках).
В 2007 году совокупный объем переданной информации равнялся 2 зеттабайтам (два миллиарда терабайтных винчестеров). Подавляющая ее часть (1,9 Зб) приходится на технологии однонаправленного вещания, то есть все разновидности ТВ, телетекст, а также газеты, журналы и GPS. При это только четверть такого вещания была цифровой. А вот на двунаправленные коммуникации в 2007-м пришлось несравнимо меньше - 65 эксабайт. Иначе говоря, в 2007-м на одного человека в день приходилось 784 Мб вещательных и только 27 Мб телекоммуникационных данных (в 1986-м - 241 и 0,16), и это - с поправками на эффективное, то есть спорадическое, использование этих каналов. Но даже с такими поправками одно вещательное устройство в среднем транслировало в 2007-м в 27 раз больше информации в день, чем один коммуникатор (компьютер, мобильный телефон, смартфон и пр.).
Грубо говоря, через телевизор три года назад изливалось в три раза больше информации, чем через интернет и связь - холодный душ на головы апологетов интернет-революции!
Впрочем, «зомбоящик» пока что побеждает, но быть ему лидером осталось недолго: за 20 лет темпы ежегодного прироста телекоммуникационных байтов опережали прирост вещательных в среднем в пять раз (6% в год - у вещателей, 28% - у телекоммуникаций). Также следует учитывать, что по вещательным каналам передаются большей частью «тяжелые» звук и видео, интернет же насыщен текстовыми и графическими данными, использующими меньше байт.
Если бы, к примеру, в 2007-м в космос к инопланетянам отправились бы все граждане Китая, то для того, чтобы взять с собой всю информацию за год - как искусственно записанную человечеством, так и переданную по всем каналам связи - каждому китайцу нужно было бы выдать всего лишь два терабайтных винчестера.
Сложнее представить наглядно совокупную вычислительную емкость цифровых устройств (аналоговые - механические арифмометры, счеты, логарифмические линейки и пр. - используется уже ничтожно мало). Производимый на протяжении 2007-го года всеми компьютерами 6,4 1012 миллион операций в секунду (МОПС) мало что дадут нашему воображению. А вот сравнительная динамика более интересна: в течение двадцати лет темпы роста именно вычислительных технологий (83% в год) значительно превышали темпы роста технологий хранения информации (23% в год) и ее передачи на расстояние (30% в год).
При этом львиная доля этих 83% приходится не на компьютеры общего назначения (серверы, суперкомпьютеры, мэйнфреймы, настольные и мобильные устройства с человеческим интерфейсом), а на прикладные компьютеры (цифро-аналоговые преобразователи, микроконтроллеры, графические процессоры).
97% МОПС, проведенные прикладными компьютерами в 2007 году, производили устройства для обработки графики. Разбитым, таким образом, оказался еще один миф: локомотивом цифровой революции является не рост коммуникаций, и не рост объема хранимой информации, а технологии по изменению информации и созданию виртуальной реальности в широком диапазоне от моделирования и построения прогностических моделей (в случае с суперкомпьютерами и сетевыми вычислениями) до игр (25% МОПС пришлось в 2007-м на видеоприставки).
Статистика статистикой, но пока не конвертирована в оптимизированные байты оставшаяся за кадром информация, играющая в нашей жизни ключевую роль (начать, хотя бы, с процесса воспитания детей, передачи культурных навыков, обмена эмоциями и опытом, личных знакомств и прочих оффлайновых и, скорей всего, алгоритмически невычислимых практик), подсчитанная информационная емкость человеческой цивилизации останется вавилонским столпотворением впечатляющих, но бессмысленных цифр, не более.
Впрочем, кое-какие сравнения с оффлайном уже возможны. 6,4 1012 МОПС, произведенных компьютерами общего назначения три года назад, уже вполне сопоставимы с числом нервных импульсов, производимых в секунду человеческим мозгом (1017).
Но это - всеми компьютерами Земли и одним полуторакилограммовым комком нейронов, функционирующим, скорей всего, совсем не по принципам двоичной логики, для которой все едино: что 10 Мб компрессированного текста, излагающего теорию струн, что 10 Мб компрессированного видео с клипом Леди Гага в паршивом качестве.
А ведь именно на такой логике, не различающей «арбузный» бит от бита «свиного хрящика», строятся пока что все попытки инвентаризовать производимую человеком информацию, в том числе и вышеописанное исследование, суммирующее банковскую транзакцию с пением соловья (принцип «нейтральности» всей информации оговорен авторами особо - он сослужил хорошую службу при подсчетах). Сумма дает большее число бит, но вот смысл составляющих теряется. Но если мы прекрасно отличаем хрящик от арбуза, а деньги от музыки, можно ли модель, подсчитывающую созданную нами информацию, научить различать в сумме битовые данные по смыслу? Если да, то такая «различающая» информационная модель различит, то есть осознает, и самое себя - станет интеллектом.
В этом случае 295 миллионов терабайтных дисков, на которых цивилизация запишет все, что в состоянии записать, модель, рано или поздно, научится адекватно сопоставлять и с другими битами - содержащимися, например, во всех ДНК взрослого человека (1023).
Двигаясь дальше, поскольку ее вычислительная способность будет возрастать (бинарные алгоритмы, например, сменят рано или поздно квантовые, дающие гигантский прирост в производительности) она сопоставит их и с 1090 бит, содержащимися в видимой части Вселенной, а также с 10120 логическими операциями, произведенными природой над этими битами за 13,5 млрд лет с момента ее рождения. Быть может, и здесь нет абсолютно ничего запретного с точки зрения физики и вычислений, кто-то уже совершил такое сопоставление мира со своей моделью. К сожалению, нельзя исключать и вероятность того, что мы живем в одной из таких моделей, где способность создания искусственного интеллекта, способного вычислить «изначального» программиста методом сопоставления данных, специально не заложена в ее программу.
Автор: Иван Куликов
| |