Добро пожаловать на сайт, Гость! Регистрация RSS

Воскресенье, 19.05.2024
Главная » 2013 » Октябрь » 31
Сегодня вряд ли кого-то удивишь двухтерабайтным винчестером, но с долговечностью мы пока не так далеко ушли от технологий полувековой давности. В обычной жизни 10-летнее хранение данных приемлемо, но, называя вещи своими именами, архивам или хотя бы библиотекам такие винчестеры не нужны. Что мы передадим будущим поколениям?
Исследователи уверены: такие способы хранения информации принципиально устойчивее, чем магнитные. Вперёд, к оптическим носителям! (Здесь и ниже иллюстрации Jeroen de Vries et al.)

Жерон де Фриз (Jeroen de Vries) из Университета Твенте (Нидерланды) задумался над этим вопросом весьма фундаментально. Лучший способ добиться долговечности, решил он, — использовать в качестве носителя систему, которой для изменения состояния потребуется энергия. Точнее — много энергии, дабы для замены каждого записанного «нуля» на ошибочную «единицу» (и наоборот) процессам старения требовалось куда больше усилий, и даже уравнение Аррениуса не позволило бы информации заметно деградировать быстрее чем за миллионы лет. Задумано — сделано?

Учёные взяли диск из вольфрама, покрытый слоем нитрида кремния. У металла, использованного для винчестера, очень низкий коэффициент теплового расширения, то есть даже значительные колебания температур слабо повлияют на изменение его размеров. Ну а неплохие механические качества нитрида кремния (как и его низкий коэффициент теплового расширения, да) эффективно защитят поверхность от случайных повреждений, не мешая при этом считыванию.

Кодирование информации было простеньким: использовался QR-код с шириной линий в 100 нм. Чтобы проверить устойчивость информации к процессам старения, диск нагревали. Согласно уравнению Аррениуса, старение диска за один час при 445 К должно быть равным старению того же диска при комнатной температуре за миллион лет. Разработка с честью прошла испытания, практически не показав старения. Подняв температуру до 848 К за час, исследователи довели образец до потери значительной части информации — однако такие условия воспроизводят уже далеко не миллион лет, так что новый носитель информации следует признать исключительно долговечным по любым меркам.

Собственно говоря, он способен прожить дольше, чем прожил род Homo, — достижение не самое тривиальное, о чём можно судить хотя бы на примере нашей с вами истории.
И вот вам авторский вывод: для текущих нужд записывания информации в интересах относительно близкого будущего этого более чем достаточно. Конечно, есть и вопросы: что будет с диском при попадании метеорита, взрыве ядерной бомбы или хотя бы энергичном пожаре (вспомним, к примеру, не такое уж давнее происшествие с Александрийской библиотекой). Наконец, сам по себе QR-код не снимает проблему читаемости информации, «законсервированной» с его помощью, а в случае вымирания соответствующих языков наши потомки упрутся в очередную рукопись Войнича или письменность острова Пасхи. Определённо, есть над чем ещё поработать, тов. де Фриз. Но вы хотя бы начали движение в нужном направлении...

QR-коды в наномасштабе.

Препринт работы можно полистать здесь.

Подготовлено по материалам Университета Твенте.
Категория: ИТ | Просмотров: 443 | Добавил: Mirra_Sun | Дата: 31.10.2013 | Комментарии (0)

Как анализ данных победил в спорте
Автор: Олег Парамонов
(Компьютерра)
Существует не так много занятий, которые вызывают меньше ассоциаций с данными и статистикой, чем спорт. Никто не становится футболистом от избытка любви к цифрам. Это делает наметившийся симбиоз спорта и науки о данных особенно интересным.

Профессиональный спорт давно превратился в серьёзный бизнес. Годовые бюджеты спортивных команд измеряются сотнями миллионов долларов, а их стоимость может превышать миллиард. Доход английской Премьер-лиги в 2013 году, согласно прогнозам, составит $4,8 млрд. Даже гольф — далеко не самый народный вид спорта — приносит около $75 млрд в год, причём речь идёт лишь о Соединённых Штатах. Для сравнения: суммарная касса мирового кинематографа в 2012 году достигла $34,7 млрд, и это считалось совсем не плохим результатом.

В 2008 году математик Стивен Строгац смоделировал историю бейсбола и доказал, что удача так же важна, как умения игрока. Модель показала, что лавры легендарного бейсболиста Джо Ди Маджо, 56 игр подряд делавшего удал на базу, могли достаться и другому.
Когда на кону такие деньги, все средства хороши. Даже настолько противоречащие традиционным представлениям о спорте, как статистика.Первыми силу цифр оценили любители бейсбола. Это не случайность. В бейсболе игра распадается на множество обособленных стадий. Это отличает его от многих других командных видов спорта. Учитывать и оценивать события в ходе бейсбольного матча гораздо проще, чем следить за хаотичными передвижениями футболистов по полю.

Основоположником современной бейсбольной статистики считается канзасский болельщик по имени Билл Джеймс. Около сорока лет назад, работая ночным сторожем на консервной фабрике, он начал собирать и анализировать информацию о каждом заслуживающем внимания бейсбольном матче. Раз в год Джеймс публиковал итоги своих изысканий.

Одержимость, с которой он изучал данные, принесла плоды. Джеймс обнаружил, что многие общепринятые идеи о том, что важно, а что нет, не находят статистического подтверждения. Например, одним из важнейших качеств бейсболиста считалась его скорость и частота контакта (этот показатель зависит от того, часто ли игрок с битой входит в контакт с мячом). Расчёты Джеймса показывали, что связь между этими качествами и исходом матча не так уж сильна. Зато на результаты команды заметно влияют совсем не очевидные факторы — такие, например, как размер поля, на котором проходят тренировки. Кроме того, статистика свидетельствовала, что разница в уровне между игроками Главной и Низшей лиг куда меньше, чем принято считать.

В конце девяностых наблюдения Джеймса заинтересовали руководство команды «Окленд Атлетикс». Её дела шли хуже некуда, и тот факт, что соперники были многократно богаче, практически лишал её шансов на успех. Лучшие игроки достаются тем, кто готов платить больше. У «Окленд Атлетикс» такой возможности не было.

Команда сделала ставку на статистику. Её менеджер заметил корреляцию между положительным исходом матча и некоторыми характеристиками спортсменов, которые редко интересуют тренеров и болельщиков. Вычисления показывали, что бэттеры, которые чаще занимают базу, и спортсмены с высоким процентом отбивания заметно повышают шансы команды на победу, но не особенно высоко ценятся. Это значит, что они по карману даже «Окленд Атлетикс».

В 2002 году команда, укомплектованная и обученная «по цифрам», выиграла двадцать матчей подряд. При этом её бюджет был едва ли не самым низким во всей Главной лиге и в два–три раза уступал лидерам. Спустя год журналист Майкл Льюис описал историю успеха «Окленд Атлетикс» в книге «Moneyball. Как математика изменила самую популярную спортивную лигу в мире», которая быстро стала бестселлером. Не так давно по ней сняли фильм под названием «Человек, который изменил всё». Менеджера команды сыграл Брэд Питт.


«Moneyball» стала последней каплей, которой не хватало для того, чтобы убедить консервативных менеджеров и тренеров в том, что цифры сильнее чутья. Бейсбольная статистика обрела такую популярность, что эта дисциплина получила особое наименование — «сейберметрика», образованное от сокращённого названия Общества исследования американского бейсбола. Последователи «Окленд Атлетикс» подходят к делу серьёзно: вместо кустарных методов, не менявшихся десятилетиями, команда «Нью-Йорк Янкиз» потратила солидные средства на внедрение системы предиктивной аналитики, разработанной SAP.

Существует несколько серьёзных научных журналов, целиком посвящённых анализу спортивных данных. Специалисты в этой области проводят регулярные конференции; одна из них недавно закончилась в Праге и была посвящена применению технологий машинного обучения и Data Mining в спорте.
Название типичного доклада или научной статьи об анализе спортивных данных соединяет несовместимые на первый взгляд вещи: "Использование алгоритма random forest для предсказания вероятности победы в матчах NFL [профессиональная лига американского футбола в США]", «Прогноз исхода голосования в кубке Гейсмана при помощи байесовского анализа». «Оценка в реальном времени ожидаемой выгоды от обладания мячом в баскетбольных матчах NBA при помощи модели пространственно-временных переходов и данных слежения за игроками»...

Возьмём последнюю работу — ту, в которой упоминаются пространственно-временные переходы баскетбольных мячей. Это хороший пример того, какой путь проделала спортивная статистика со времён Билла Джеймса. Модель, которую разработали в Гарварде, основана на измерениях, выполняемых автоматически с помощью анализа видео и распознавания образов.
... Читать дальше »
Категория: Наука | Просмотров: 827 | Добавил: Mirra_Sun | Дата: 31.10.2013 | Комментарии (0)