"Обычный компьютерный Zip-архиватор распознаёт музыкальный стиль, не проиграв ни одной ноты из файла с неизвестным опусом. И даже поможет исследователям-музыковедам определить автора анонимного произведения", радует New Scientist. Что, правда?
В последнее время "Новый учёный" в редких паузах между сводками с иракского и антипневмонийного фронтов балует нас несвойственными этому изданию в более спокойные периоды не слишком достоверными, мягко говоря, новостями.
Сначала попробуем понять, что же сообщает авторитетный источник, а уже потом будем полемизировать и "раскрашивать" приглянувшуюся публикацию.
Итак, в печатном варианте журнала от 15 декабря 2001 года содержится статья о том, что ходовая программа-архиватор WinZip очень пригодится для определения языка, на котором написан непонятный фрагмент текста.
Техника распознавания довольно проста. Берём несколько объёмных файлов с документами, составленными на известных языках. Последовательно сжимаем эти тексты, запоминая при этом размер получившихся архивов.
Затем, берём наш текст загадочного происхождения и последовательно дописываем в конец каждого из несжатых разноязыких файлов. Получившиеся "бутерброды" заново архивируем.
Язык документа, размер архива которого меньше всего увеличился при добавлении неизвестного фрагмента, и будет, вероятнее всего, языком этого самого фрагмента. Всё.
Охотно допускаем, что так оно, теоретически, и должно быть. Дело в том, что этот эксперимент — не более чем ловкий трюк циркача на арене перед простодушными зрителями.
Как работает алгоритм сжатия, используемый программой WinZip? Для начала приведём свой пример.
Возьмите простейший текстовый редактор типа "блокнот". Введите в него на 10 килобайт ценной информации. Сожмите WinZip'ом — получите архив "весом" порядка 3,5 Кб. Запомнили?
| ||
Цифры могут несколько отличаться от приведённых, но тенденция предсказана правильно.
Почему так? WinZip в процессе сжатия, грубо говоря, составляет полный "словарь" всего документа, а затем заменяет в архиве сами слова ссылками на соответствующую словарную статью.
Поэтому оттого, что мы продублировали документ, состав словаря, как раз и занимающего больше всего места, не изменился, а возросло лишь количество обращений к его статьям, незначительно увеличив размер архива удвоенного исходного файла.
Более доходчивое и детальное описание работы архиватора можно найти здесь, но, надеемся, и так понятно, почему работает схема из New Scientist.
Чем ближе язык непонятного текста к определённому словарю, тем выше вероятность совпадений. Следовательно, тем меньше "разбухнет" архив.
А теперь вернёмся к свежей, заинтриговавшей нас, истории с музыкальным архивированием.
Группа учёных из Голландского национального исследовательского института (Dutch National Research Institute) задумалась: нельзя ли приложить ту же методику к музыкальным фрагментам, чтобы определить стиль исполнения.
Для исследования были взяты фрагменты произведений трёх жанров — классики, джаза и рока, всего по 12 единиц каждого. За эталоны чистоты выбрали Бетховена, Майлза Дэвиса и Джимми Хендрикса.
С полученными треками проделали манипуляции аналогичные тем, что и с текстовыми файлами: "зазиповывали" и проверяли на предмет сходства с остальными. Результаты должны были распределяться по трём категориям, в каждой из которых размещались пьесы, относящиеся к одному и тому же направлению.
Результаты ошеломляющие: архиватор кстати, это был не WinZip, а Bzip2, правильно определил 10 джазовых, 9 роковых и "большинство" классических фрагментов. То есть, распределил их по соответствующим категориям.
Исследователи подозревают, что точно так же можно узнать имя композитора безымянной записи, если известны какие-то другие произведения, несомненно ему принадлежащие.
| ||
А в качестве очевидного применения технологии, предлагают онлайновым музыкальным магазинам использовать её для классификации содержимого своих бездонных хранилищ.
Методикой остался очень доволен Джереми Саммерли (Jeremy Summerly) из лондонской Королевской академии музыки (Royal Academy of Music): "Я бы полюбил технику, способную вычислить автора простой обработкой нот его произведения".
У Джереми накопилось много музыкальных пьес XVI века, авторы которых неизвестны, и он решительно не знает, что с ними делать.
Есть и другая идея: многим ещё до сих пор не ясно, что во второй части "Реквиема" написал Моцарт, а что Зюсмайр. Почему бы компьютеру, наконец, не восстановить справедливость?
Начинаем полемизировать. Товарищи учёные, видимо, шутят, а New Scientist не смешно. Для начала: обозреватель журнала, похоже, вообще не понимал, о чём идёт речь.
Вы не задумывались, почему никогда не встречали "зазиповыванных" музыкальных файлов? Возьмите простой аудиодиск и перепишете один трек на винчестер, только не как "МР3", а как "wav" (например, программой Cdex), а потом сожмите WinZip'ом.
Если очень постараетесь выгадаете пару процентов объёма. Не сжимают так звуковые файлы (и картинки), не выйдет. Для их сжатия нужные другие программы, работающие по иным законам.
А у WinZip-a или Bzip2 не получится никакого "словаря", поэтому все дальнейшие аналогии с текстами начисто лишены смысла.
Позвольте, какие ID-тэги, откуда, причём они здесь, уж не имел ли автор в виду звук, сдавленный до состояния МР3?
Нет, складывается впечатление, что использовалась какая-то упорядоченная система музыкальной "каллиграфии" (иначе WinZip ни к чему), причём более изощрённая, чем привычная нотная грамота.
Ведь общеизвестно, что многие нюансы джазового исполнения не поддаются нотной записи, хотя играют принципиальную роль при определении авторства.
Но, обо всех этих гипотетических системах остаётся только догадываться. В любом случае, такая "очистка" музыки не есть простое арифметическое сжатие, и может оказаться выдачей желаемого за действительное. То есть, нас как минимум ещё раз тонко надули.
Далее, нет никаких данных об успешных попытках определения, при помощи архивации специально составленных "музыкальных полуфабрикатов", авторства мелодии. Вот и получается, что New Scientist, по собственному произволу, разжёг искру в пламя.
А что касается идентификации жанровой принадлежности, то её по одному только музыкальному размеру, без всякого сжатия, можно вычислить в пять секунд и практически безошибочно (исключая случаи смешения стилей).
Музыка, конечно, строится по точным законам, и проверять алгеброй гармонию, возможно, вполне допустимо, но не до такой же абсурдной степени.
И ещё, о текстах. В филологии различные методы компьютерного лингвистического анализа, куда более сложные и отработанные, чем WinZip и Bzip2, применяются уже много десятилетий. Однако даже в этой области "особое мнение" программы не более чем принимают к сведению.
Статья получена: Membrana.ru