Рукопись Войнича осмыслена или Рукопись нельзя дешифровать

Рукопись Войнича осмыслена
7
Нейтральная
сторона
0
Рукопись нельзя дешифровать
5
и её можно дешифровать
Прежде чем писать комментарии или выбрать сторону вы должны авторизироваться!
Мистификация, бред сумасшедшего, бессмысленный набор слов

03-07-2016 05:11 0

Насколько я помню, она слишком круто подпадает под статисческие закономерности естественных языков.
Грубо говоря, когда в готовом тексте выделяют, например, буквы "о" и "ы", и по характеру их распределения делают вывод может ли данный текст относиться к русскому, или какому другому языку; соотносятся сведения из текста с официальными корпусами или специальными текстами-эталонами, отобранными для проверки совпадения с конкретным языком, или его стадией. Доходит до того, что компьютер может без особых проблем расшифровать текст, где все символы алфавиты заменены вообще любыми графемами. Иной раз не спасает даже переход на слоговое письмо.
Я не особо вдавался в историю шифровок-дешифровок, но Войнич какой-то прям очень крутой. Его бы давно уже выкинули и забыли, да только вот при внимательном изучении он всё ещё слишком похож на языковое сообщение. А если это стилизация, то она прям подозрительно круто сделана. Такой уровень замаскированной асемии (вот это например - www.principiadiscordia.com/downloads/Cod ...) даже сегодня не все могут продемонстрировать. К тому же прям асемия должна иметь в себе какую-то цель, так что Войнич всё ещё остаётся неплохой такой загадкой.
С другой стороны, можно вспомнить ронго-ронго, с которым лингвисты бьются уже более века. И вроде там настоящий язык, но пока все сходятся на принципиальной невозможности дешифровки. Впрочем, никто не исключает, что сами таблички с ронго-ронго могут быть вполне себе осмысленными.
Сюда же можно вспомнить Фестский диск: ru.wikipedia.org/wiki/Фестский_диск

19 комментариев
Jotun 03-07-2016 21:28 +1

Simple_Not, Я ждал, что кто-то вспомнит про Codex Seraphinianus.

Насколько я помню, она слишком круто подпадает под статисческие закономерности естественных языков.
Грубо говоря, когда в готовом тексте выделяют, например, буквы "о" и "ы", и по характеру их распределения делают вывод может ли данный текст относиться к русскому, или какому другому языку; соотносятся сведения из текста с официальными корпусами или специальными текстами-эталонами, отобранными для проверки совпадения с конкретным языком, или его стадией.

Там дело даже не в использовании букв. Как раз таки наоборот: подобный пример помогает распознать формализовано принадлежность текста к конкретному языку, но не осмысленность текста вообще. Тут скорее играют роль другие статистические параметры, такие, как закон Ципфа, например.

Вообще меня заинтересовал такой вопрос: в первую очередь (прежде, чем говорить о дешифровке как таковой) следует четко определиться с тем, является ли
а) этот текст вообще осмысленным текстом, а не набором букв или слов
б) этот манускрипт текстом, написанным на естественном языке или на языке искусственном.

И с обеими задачами (которые по сути являются типичными задачами классификации) отлично справляются всякие нейронные сети (ну и просто программы-классификаторы). Спойлер



Подводя итог, годнота конечно. Если это след какой-то утерянной цивилизации или какой-нибудь тайной жидомассонской организации, то я рад, что живу в мире, где столько лет спустя могут оставаться подобные загадки.
Если это фейк и мистификация родом из Средневековья, что же, склоняю шляпу перед таким многовековым троллингом.

Simple_Not 04-07-2016 01:34 +1

Jotun, В варе, кстати, всплывает классическая проблема - люди склонны воспринимать письменность как язык. Хотя система записи языка вовсе не тождественна последнему.

opera.rulez 04-07-2016 14:19 0

Simple_Not, Помоги мне развидеть Кодекс Серафини. Даже логотип владивостокской автошколы не вызывал таких рвотных позывов.

У психолухов есть тест «Нарисуй несуществующее животное». Что-то мне подсказывает, что психолухи у Серафини диагностировали бы шизофрению или хотя бы употребление алкоголя, марихуаны или ЛСД, ибо количество несочетаемых деталей и вычурных ассоциаций зашкаливает. Но у шизофреников, алкоголиков и наркоманов обычно нет такой последовательности, как в кодексе. Это и пугает.

Simple_Not 04-07-2016 14:22 +1

opera.rulez, Автор грит, что всё специально делалось, чтобы у тебя был такой эффект.

opera.rulez 04-07-2016 14:30 0

Jotun, > Там дело даже не в использовании букв.

Если я правильно понял Симпла, то он довольно жирно намекал на частотный криптоанализ. Если текст зашифрован простой подстановкой (букву А заменили каким-нибудь значком ☢, букву Б — значком ★ и т. д.), то это легко ломается, если хотя бы примерно знаешь, к какой группе/семье относится язык.

В большинстве европейских языков самая популярная буква — E, вторая по популярности буква — T. Недаром в азбуке Морзе они обозначены однозначными кодами (точка и тире соответственно), а в клавиатурной раскладке ЙЦУКЕН находятся близко к центру. Посмотри двухзначные коды азбуки Морзе, и узнаешь следующие по популярности буквы.

Частотный анализ не работает на коротких текстах (потому что там не успевает набраться статистика) и на более сложных способах шифрования.

Jotun 04-07-2016 20:25 +1

opera.rulez, Дык он же сработает только при непосредственном шифровании какого-то известного языка, а это настолько примитивный вариант, который легко дешифруется на текстах подобного размера, что я его даже не учитывал.

Уже сколь-нибудь более сложное по сравнению с обычной подстановкой или кодом Цезаря шифрование приводит к тому, что частотный анализ не дает практически ничего, по идее.

opera.rulez 04-07-2016 20:59 0

Jotun, Согласен. Ещё немного побуду капитаном Очевидностью, чтобы всё разложить по полочкам.

По идее ещё шифр Виженера (и подобные простые полиалфавитные) ломается, если ты точно знаешь длину ключа (или хотя бы подобрал число, кратное длине ключа): разбиваешь текст на N частей (в первой части каждая kN-я буква, во второй — каждая (kN+1)-я буква и т. д.) и для каждой проводишь частотный анализ, а потом склеиваешь обратно. Разумеется, для взлома длина текста должна во много раз превосходить длину ключа, иначе мы имеем дело с невзламываемым одноразовым блокнотом.

А так, да, стоит ввести хоть какую-то зависимость зашифрованного блока от предыдущего, как частотный анализ ничего не даст. Но у меня есть сомнения, что шифры со сцеплением использовались в доэлектронную эпоху, ведь стоит потерять одну букву (тупо замаралась страница книги), как весь текст, идущий далее, будет необратимо испорчен (вспомни, например, побитые зип- и рар-архивы, если на такие натыкался).

Из простого трудновскрываемого приходит в голову перестановка (анаграмма). Частотным анализом мы можем восстановить только алфавит, но не расположение букв. Чего сто́ит известная фраза «ceiiinosssttuv», о значении которой нельзя догадаться вне контекста.

Меня интересуют два вопроса (предположим, что меня забанили в Гугле):

1. Какие шифры применялись в доэлектронную эпоху?

2. Какие статистические закономерности (кроме упомянутых частот букв и закона Ципфа) известны для текстов реальных языков?

opera.rulez 04-07-2016 21:10 0

Simple_Not, > Хотя система записи языка вовсе не тождественна последнему.

В качестве иллюстрации нужно вспомнить языки, менявшие письменность:
1. Языки Средней Азии + азербайджанский, которые пережили арабскую письменность, латиницу и кириллицу (а некоторые даже два варианта латиницы).
2. Румынский, переживший кириллицу и латиницу, и молдавский, переживший два варианта кириллицы и латиницу.
3. Турецкий, переживший арабское письмо и латиницу.
4. Вьетнамский, переживший иероглифы и латиницу.
5. Японский, у которого «в штатном режиме» существует несколько письменностей: иероглифы, две каны, про запас кунрэй/нихон и непризнанная де юре, но существующая де факто хепбёрновка.
6. Несметное количество языков, у которых сначала было иероглифическое или слоговое письмо, а потом пришла кириллица или латиница.

Даже в русском алфавит несколько раз менялся, хотя и не так кардинально.

Ничего интересного не пропустил?

Jotun 04-07-2016 21:13 0

opera.rulez, Пропустил чероки, которые сделали микс из своей иероглифики (или как это правильно называть) и латиницы.

opera.rulez 04-07-2016 21:17 0

Jotun, С чероки всё сложно: там не латиница, а лишь знаки, случайно совпавшие по начертанию с латиницей, но имеющие другую функцию: D, R, T — это гласные, а A, J, E — это вообще целые слоги. Ну чтобы не было скучно.

До этой письменности у них была другая?

Jotun 04-07-2016 21:30 +2

opera.rulez, Какие статистические закономерности (кроме упомянутых частот букв и закона Ципфа) известны для текстов реальных языков?
Думаю, таких, чтобы формализовано и красиво выражались математически, толком и нет, ведь потому NLP настолько эмпиричен на первый взгляд. Тем не менее, интеллектуальные программы прекрасно находят такие закономерности, если удачно подобрать features и обучающий материал.

Какие шифры применялись в доэлектронную эпоху?
Тут без гугла ничего не могу сказать, но даже подстановочный полиалфавитный шифр (который легко мог быть реализован и вручную) мог оказаться невероятно криптостойким, если обладал достаточно длинным ключом (не словом и не предложением, а целой книгой, например).
Но касательно манускрипта Войнича все это разбивается об один факт, а именно о тот факт, что скорость письма была достаточно большой даже для профессионального писца, что означало легкость в формировании фраз и полную осознанность того, что пишется.
Лично я слабо представляю, как можно быстро писать абракадабру, которая получается в результате подобного шифрования

Simple_Not 05-07-2016 01:32 0

Jotun, Вот только человеку, который этим не интересуется для примера хватит и частотного анализа.

Simple_Not 05-07-2016 01:43 +1

opera.rulez, Вьетнамцы спокойно перебрались на латынь. Китайскими иероглифами очень долгое время общалась вся Юго-Восточная Азия, несмотря на все национальные и языковые различия.
Сам китайский даже официально сейчас записывается иероглифами и латиницей (в смысле, через пиньинь). До сих пор сохранились варианты китайского письма через кирилицу, и даже арабскую вязь.

Simple_Not 05-07-2016 01:44 +1

opera.rulez, Не так-то уж и сложно вроде. Обычная слоговая письменность, причём довольно стройная. Знаки были рандомно надёрганы автором после знакомства с закорючками в американских газетах. Ранее у чероки, вроде бы, вообще не было вменяемой письменности.

opera.rulez 05-07-2016 12:56 0

Simple_Not, Вспомнил о тесте для (предположим, японских или эфиопских) детей дошкольного возраста. Вот набор закорючек:
ABCDEFGHIJKLMNOPQRSTUVWXYZ

Продолжите начатую двухстрочную последовательность из этого набора:
AEFHIKLMN
BCDGJO

opera.rulez 05-07-2016 13:02 0

Jotun, > скорость письма была достаточно большой даже для профессионального писца

При использовании шифра Виженера или анаграмм выдержать большую скорость вряд ли получится, потому что нужно отсчитывать позиции букв. Я уже не говорю о шифрах со сцеплением.

Так что похоже, что тут либо простая подстановка (просто выбран фантастический алфавит), либо бессмыслица.

Простая подстановка для известных языков легко вскрывается, как мы уже заметили.

Вывод: либо это текст на неизвестном языке, либо принципиальная бессмыслица.

Хотя возможен вариант, что это необычная письменность для известного языка. Представь себе, как резко изменились частотные характеристики русского языка после отмены буквы «ять» и финальных твёрдых знаков.

Eevee 05-07-2016 13:25 +1

opera.rulez, В первом только прямые линии, а во втором есть закругления. Я угадал?

opera.rulez 05-07-2016 13:58 +1

Eevee, Да, именно так.

К чему я вспомнил об этой забаве? Для изобретателя черокской письменности латинские буквы были всего лишь картинками. Он выбирал те, которые ему казались красивее. Поэтому назвать результат латиницей у меня язык не повернётся, тем более, что письменность чероки вообще не алфавитная, а слоговая.

Simple_Not 05-07-2016 14:30 +1

opera.rulez, Есть ещё вероятность, что это особо мудрёная шифровка. Войнич-то не один такой документ, их если не сотнями то десятками исчислить можно, причём найдены они и в более ранние времена. Составитель явно мог иметь знакомство с тайнописями тех времён.

03-07-2016 22:45 +3

Возможен третий вариант: рукопись осмысленна, но её нельзя дешифровать. Это вполне возможно, если автор был врачом.

9 комментариев
vosmoi 03-07-2016 23:24 +1

opera.rulez, точно. Так и представляю, как цивилизации будущего копаются в наших костях и пытаются дешифровать слепки с медицинских рецептов. Они бы выделили медицинские письмена в отдельный язык, предполагая, что медицинские знания прошлого считались секретными для простых смертных, поэтому они были понятны только посвященным.

opera.rulez 04-07-2016 00:02 0

vosmoi, Прогресс преподносит и другие загадки:


Вот тут вроде и буквы легко опознаются, но ничего нельзя понять. Даже если слова, отсутствующие в русском языке, заменить близкими по звучанию геометрическими терминами, всё равно смысла нет.

BerkutOi 04-07-2016 14:39 0

opera.rulez, а мне вот сегодня врач выписала направление на анализы и на этих направлениях все понятно, может она плохой врач?

Kiok 04-07-2016 14:41 0

BerkutOi, У меня почерк хорошего врача. Я хороший врач?

BerkutOi 04-07-2016 14:55 0

Kiok, не, тут логическая связь односторонняя только

BerkutOi 04-07-2016 14:56 0

Kiok, хотя если серьезно, то это первый раз когда я был в поликлинике и ушел от-туда с хорошим настроением, потому что внезапно все были вежливыми и всё мне обьяснили куда и зачем идти, хотя бомбит что у них нет денег на ленты для кардиографа, и на перчатки и иголку для анализа крови

Kiok 04-07-2016 14:56 0

BerkutOi, Чорт..

Simple_Not 04-07-2016 15:09 +2

BerkutOi, Я после врачебного почерка порой лишний раз задумываюсь о том, насколько наша письменность ещё отстаёт от реальных возможностей мозга. Вот вроде смотришь на явно судорожные линии без какого-либо смысла, а потом как-то раз - и вдруг потихоньку читаешь цельные слова и весь текст. При этом даже когда всё прочитал порой ну очень сложно опознать отдельные буквы лишь по внешнему виду написанного. Фактически, это уже не алфавитное письмо, а его логографическое отображение.

BerkutOi 04-07-2016 15:18 0

Simple_Not, у меня такая проблема с калиграфическими почерками, ебанутым написанием т, ш, и, щ, когда по миллиону одинаковых закорлючек(меня за школу вообще так и не научили писать т красивую, и я стал писать печатную), я из них не могу выделить буквы, а вот тексты врачей приходилось расшифровывать по-буквам обычно

04-07-2016 14:12 +1

Возможен ли вариант, что это склейка нескольких книг, одна из которых имеет смысл, а остальные — нет?

На буквы не смотрел, смотрел на картинки.

1. В первой половине книги фантастические растения заведомо нереальных форм. Ну не могут так корни состыковываться со стеблями, даже на лубочных картинках и на растительных узорах такой фантастики не встречалось.

2. Дальше несколько страниц с «нимфами», лежащими в фантастических ваннах.

3. Наконец, в последней части книги растения похожи на реальные. Вроде даже специалисты многие из них опознали.

А вдруг именно последняя часть имеет смысл, а остальные части служат для запутывания неприятеля?

1 комментарий
vosmoi 04-07-2016 15:28 +1

opera.rulez, В первой половине книги фантастические растения заведомо нереальных форм
Мне кажется это для большего эффекта. Ну, растения из дальних неведомых земель или древних веков + несколько реальных растений для общего реализма.

Например, если книга нужна для мошенничества, то я могу представиться так, что якобы могу излечить любой недуг. Я могу показать лечебные растения из книги, которые растут только в пиздец далеких странах, а на поездочку нужны деньги. Ну и спец я такой офигенный, что только я один и знаю что там написано.

03-07-2016 22:24 +2

Я прочитал статью и склоняюсь к версии о том, что книга является подделкой, которая была создана или для мошенничества (у-у-у, книга алхимика, написанная на тайном языке), или для личных интересов Марци - первого подтвержденного владельца.

Место и время и создания текста известны, а язык не похож ни на один другой. Это же не фрески 3 тыс. лет давности, а книга созданная недавно, во времени, которое хорошо изучено. Язык должен был быть на что-то похожим, если он естественный.

Если язык искусственный, то дешифровка множеством крутых спецов не могла дать пустой результат, ведь там даже картинок до кучи, контекст известен, а значит смыслы слов находить должно быть просто, но нет, не нашли.

Поэтому думаю это набор придуманных заранее случайно расставленных слов. Тем более в той же статье упоминается, что количество слов ниже обычного в других языках.

12 комментариев
Jotun 03-07-2016 22:29 0

vosmoi, Тем более в той же статье упоминается, что общее количество повторяющихся слов выше обычного в языке.
Выше обычного в европейских языках же.

Если язык искусственный, то дешифровка множеством спецов своего дела не могла дать пустой результат, ведь там даже картинок до кучи, контекст известен, а значит смыслы слов находить должно быть просто, но нет, не нашли.
Там картинок-то полно, но их смысл весьма туманный.
А контекст - это вообще фигня. Какой уж там контекст, если даже не у всех разделов реальная тематика понятна?
Плюс это может быть намеренно зашифрованный текст, написанный на реальном языке.

vosmoi 03-07-2016 22:40 0

Jotun, Там картинок-то полно, но их смысл весьма туманный.
А контекст - это вообще фигня. Какой уж там контекст, если даже не у всех разделов реальная тематика понятна?

Нормально, раздел с растениями там огромный, и картинок под сотню. Мне кажется маловероятным, что такая огромная куча текста с картинками может быть не дешефрована в принципе (да даже без картинок). Это же не осколок древнего камня с письменами, а куевы 5 см листов. Я склоняюсь к версии, что книга не имеет смысла.

Jotun 03-07-2016 23:04 0

vosmoi, Там половина растений выдуманная, или просто нихрена не понятно.
Кстати, одна из последних трактовок (связанная внезапно с ацтеками, лол) основывается именно на расшифровке "ботанического" раздела в связи с сопоставлением картинок с реальными растениями.
И все же это так себе. Картинка в тексте зачастую может значить что угодно.

Давай проведем эксперимент:


Вот скриншот рандомной статьи из википедии, в которую я попал, просто клацая по ссылкам на непонятном мне языке. Попробуй угадать хотя бы примерно о чем идет речь, исходя из иллюстрации.

persik 03-07-2016 23:09 0

vosmoi, Я тут тупанул.

Jotun 03-07-2016 23:13 0

persik, Ну, формально он определяет время создания пергамента и чернил, а не написания текста, что оставляет простор для упоротых теорий.

vosmoi 03-07-2016 23:20 0

Jotun, Давай проведем эксперимент
Если бы у нас было еще было сотню таких статей, явно объединенных в одну тематику, то мы бы смогли выловить повторения слов и понять их смысл. Мы бы нашли, например, что у стальных строений почти всегда повторяется одно слово, которое бы предположительно означало "металлическое". Это грубый пример, но принцип был бы похожим.

Jotun 03-07-2016 23:20 0

persik, Надо запретить редактировать комментарии, на которые кто-то уже ответил :)

Jotun 03-07-2016 23:22 0

vosmoi, Так тут в чем соль: вот у нас есть тематика. Есть словарь повторяющихся слов, которые встречаются на страницах данной тематики. Мы даже так или иначе можем определить их части речи (возможно).
Но тематика, которая у нас есть, включает в себя растения, фармакологию, алхимию и хрен его знает, что ещё, и набор слов, которые могут повторяться в таких текстах становится критически огромным, что не позволяет дешифровать его комбинаторным путём.

vosmoi 03-07-2016 23:28 +1

Jotun, тематика, которая у нас есть, включает в себя растения, фармакологию, алхимию и хрен его знает, что ещё, и набор
Разделы же не перемешаны, они следуют друг за другом, поэтому пофиг.

Вообще, ты серьезно считаешь, что спецы которые ломали шифры второй мировой войны и современные ученые, не смогли найти ключи к пониманию этой книги? Вероятнее то, что ключей нет, чем то, что они бы не разобрались. Это мы тут лохи строим предположения, а у них вся жизнь посвящена дешифровке.

Jotun 03-07-2016 23:31 0

vosmoi, Вообще, ты серьезно считаешь, что спецы которые ломали шифры второй мировой войны и современные ученые, не смогли найти ключи к пониманию этой книги?
Эм, шифры второй мировой шифровали сообщения, написанные естественным языком и намеренно зашифрованные, это немного другое все же.

Разделы же не перемешаны, они следуют друг за другом, поэтому пофиг.
Если ты внимательно читал, ты мог заметить, что там на самом деле нет никаких разделов. Просто рукопись условно разделили на части, которым присвоили названия, отдаленно соответствующие содержимому иллюстраций. Так что тематика (особенно, если вспомнить про общий оккультный оттенок манускрипта) может сильно разниться, если не считать, пожалуй, ботанического раздела, да.

persik 04-07-2016 00:02 0

Jotun, Я там проглядел ключевые слова, потому что прочитал по диагонали.

Simple_Not 04-07-2016 01:32 +1

vosmoi, Тем не менее даже лучшие дешифровщики не осилили взломать тех же навахо, которые просто вели эфир на своём языке.
Наличие текста вообще не особо спасает. Сам по себе текст ну очень редко раскрывает хоть какую-то семантику, если он не идеографический. Основной способ дешифровки непонятных старых письмен - это нахождение цельной билингвы, либо перевода на другой текст, записи того же текста другой письменностью.