Рукопись Войнича осмыслена или Рукопись нельзя дешифровать

Рукопись Войнича осмыслена
8
Нейтральная
сторона
0
Рукопись нельзя дешифровать
5
и её можно дешифровать
Прежде чем писать комментарии или выбрать сторону вы должны авторизироваться!
Мистификация, бред сумасшедшего, бессмысленный набор слов

03-07-2016 05:11 0

Насколько я помню, она слишком круто подпадает под статисческие закономерности естественных языков.
Грубо говоря, когда в готовом тексте выделяют, например, буквы "о" и "ы", и по характеру их распределения делают вывод может ли данный текст относиться к русскому, или какому другому языку; соотносятся сведения из текста с официальными корпусами или специальными текстами-эталонами, отобранными для проверки совпадения с конкретным языком, или его стадией. Доходит до того, что компьютер может без особых проблем расшифровать текст, где все символы алфавиты заменены вообще любыми графемами. Иной раз не спасает даже переход на слоговое письмо.
Я не особо вдавался в историю шифровок-дешифровок, но Войнич какой-то прям очень крутой. Его бы давно уже выкинули и забыли, да только вот при внимательном изучении он всё ещё слишком похож на языковое сообщение. А если это стилизация, то она прям подозрительно круто сделана. Такой уровень замаскированной асемии (вот это например - www.principiadiscordia.com/downloads/Cod ...) даже сегодня не все могут продемонстрировать. К тому же прям асемия должна иметь в себе какую-то цель, так что Войнич всё ещё остаётся неплохой такой загадкой.
С другой стороны, можно вспомнить ронго-ронго, с которым лингвисты бьются уже более века. И вроде там настоящий язык, но пока все сходятся на принципиальной невозможности дешифровки. Впрочем, никто не исключает, что сами таблички с ронго-ронго могут быть вполне себе осмысленными.
Сюда же можно вспомнить Фестский диск: ru.wikipedia.org/wiki/Фестский_диск

12 комментариев
Jotun 03-07-2016 21:28 +2

Simple_Not, Я ждал, что кто-то вспомнит про Codex Seraphinianus.

Насколько я помню, она слишком круто подпадает под статисческие закономерности естественных языков.
Грубо говоря, когда в готовом тексте выделяют, например, буквы "о" и "ы", и по характеру их распределения делают вывод может ли данный текст относиться к русскому, или какому другому языку; соотносятся сведения из текста с официальными корпусами или специальными текстами-эталонами, отобранными для проверки совпадения с конкретным языком, или его стадией.

Там дело даже не в использовании букв. Как раз таки наоборот: подобный пример помогает распознать формализовано принадлежность текста к конкретному языку, но не осмысленность текста вообще. Тут скорее играют роль другие статистические параметры, такие, как закон Ципфа, например.

Вообще меня заинтересовал такой вопрос: в первую очередь (прежде, чем говорить о дешифровке как таковой) следует четко определиться с тем, является ли
а) этот текст вообще осмысленным текстом, а не набором букв или слов
б) этот ма*ускрипт текстом, написанным на естественном языке или на языке искусственном.

И с обеими задачами (которые по сути являются типичными задачами классификации) отлично справляются всякие нейронные сети (ну и просто программы-классификаторы). Спойлер



Подводя итог, годнота конечно. Если это след какой-то утерянной цивилизации или какой-нибудь тайной жидомассонской организации, то я рад, что живу в мире, где столько лет спустя могут оставаться подобные загадки.
Если это фейк и мистификация родом из Средневековья, что же, склоняю шляпу перед таким многовековым троллингом.

Simple_Not 04-07-2016 01:34 +1

Jotun, В варе, кстати, всплывает классическая проблема - люди склонны воспринимать письменность как язык. Хотя система записи языка вовсе не тождественна последнему.

Simple_Not 04-07-2016 14:22 +1

Автор грит, что всё специально делалось, чтобы у тебя был такой эффект.

Jotun 04-07-2016 20:25 +1

Дык он же сработает только при непосредственном шифровании какого-то известного языка, а это настолько примитивный вариант, который легко дешифруется на текстах подобного размера, что я его даже не учитывал.

Уже сколь-нибудь более сложное по сравнению с обычной подстановкой или кодом Цезаря шифрование приводит к тому, что частотный анализ не дает практически ничего, по идее.

Jotun 04-07-2016 21:13 0

Пропустил чероки, которые сделали микс из своей иероглифики (или как это правильно называть) и латиницы.

Jotun 04-07-2016 21:30 +2

Какие статистические закономерности (кроме упомянутых частот букв и закона Ципфа) известны для текстов реальных языков?
Думаю, таких, чтобы формализовано и красиво выражались математически, толком и нет, ведь потому NLP настолько эмпиричен на первый взгляд. Тем не менее, интеллектуальные программы прекрасно находят такие закономерности, если удачно подобрать features и обучающий материал.

Какие шифры применялись в доэлектронную эпоху?
Тут без гугла ничего не могу сказать, но даже подстановочный полиалфавитный шифр (который легко мог быть реализован и вручную) мог оказаться невероятно криптостойким, если обладал достаточно длинным ключом (не словом и не предложением, а целой книгой, например).
Но касательно ма*ускрипта Войнича все это разбивается об один факт, а именно о тот факт, что скорость письма была достаточно большой даже для профессионального писца, что означало легкость в формировании фраз и полную осознанность того, что пишется.
Лично я слабо представляю, как можно быстро писать абракадабру, которая получается в результате подобного шифрования

Simple_Not 05-07-2016 01:32 0

Jotun, Вот только человеку, который этим не интересуется для примера хватит и частотного анализа.

Simple_Not 05-07-2016 01:43 +1

Вьетнамцы спокойно перебрались на латынь. Китайскими иероглифами очень долгое время общалась вся Юго-Восточная Азия, несмотря на все национальные и языковые различия.
Сам китайский даже официально сейчас записывается иероглифами и латиницей (в смысле, через пиньинь). До сих пор сохранились варианты китайского письма через кирилицу, и даже арабскую вязь.

Simple_Not 05-07-2016 01:44 +1

Не так-то уж и сложно вроде. Обычная слоговая письменность, причём довольно стройная. Знаки были рандомно надёрганы автором после знакомства с закорючками в американских газетах. Ранее у чероки, вроде бы, вообще не было вменяемой письменности.

Eevee 05-07-2016 13:25 +1

В первом только прямые линии, а во втором есть закругления. Я угадал?

Simple_Not 05-07-2016 14:30 +1

Есть ещё вероятность, что это особо мудрёная шифровка. Войнич-то не один такой документ, их если не сотнями то десятками исчислить можно, причём найдены они и в более ранние времена. Составитель явно мог иметь знакомство с тайнописями тех времён.

Trikcster 10-10-2017 14:10 +1

У психолухов есть тест «Нарисуй несуществующее животное».
Вот жеж блин а я на просьбу нарисовать животное, нарисовал несусветную поебень... Видна я всё-таки псих... Хотя позже мне приходила мысль что не надо не чего рисовать, - оно же не существует!

03-07-2016 22:24 +3

Я прочитал статью и склоняюсь к версии о том, что книга является подделкой, которая была создана или для мошенничества (у-у-у, книга алхимика, написанная на тайном языке), или для личных интересов Марци - первого подтвержденного владельца.

Место и время и создания текста известны, а язык не похож ни на один другой. Это же не фрески 3 тыс. лет давности, а книга созданная недавно, во времени, которое хорошо изучено. Язык должен был быть на что-то похожим, если он естественный.

Если язык искусственный, то дешифровка множеством крутых спецов не могла дать пустой результат, ведь там даже картинок до кучи, контекст известен, а значит смыслы слов находить должно быть просто, но нет, не нашли.

Поэтому думаю это набор придуманных заранее случайно расставленных слов. Тем более в той же статье упоминается, что количество слов ниже обычного в других языках.

12 комментариев
Jotun 03-07-2016 22:29 0

vosmoi, Тем более в той же статье упоминается, что общее количество повторяющихся слов выше обычного в языке.
Выше обычного в европейских языках же.

Если язык искусственный, то дешифровка множеством спецов своего дела не могла дать пустой результат, ведь там даже картинок до кучи, контекст известен, а значит смыслы слов находить должно быть просто, но нет, не нашли.
Там картинок-то полно, но их смысл весьма туманный.
А контекст - это вообще фигня. Какой уж там контекст, если даже не у всех разделов реальная тематика понятна?
Плюс это может быть намеренно зашифрованный текст, написанный на реальном языке.

vosmoi 03-07-2016 22:40 0

Jotun, Там картинок-то полно, но их смысл весьма туманный.
А контекст - это вообще фигня. Какой уж там контекст, если даже не у всех разделов реальная тематика понятна?

Нормально, раздел с растениями там огромный, и картинок под сотню. Мне кажется маловероятным, что такая огромная куча текста с картинками может быть не дешефрована в принципе (да даже без картинок). Это же не осколок древнего камня с письменами, а куевы 5 см листов. Я склоняюсь к версии, что книга не имеет смысла.

Jotun 03-07-2016 23:04 0

vosmoi, Там половина растений выдуманная, или просто нихрена не понятно.
Кстати, одна из последних трактовок (связанная внезапно с ацтеками, лол) основывается именно на расшифровке "ботанического" раздела в связи с сопоставлением картинок с реальными растениями.
И все же это так себе. Картинка в тексте зачастую может значить что угодно.

Давай проведем эксперимент:


Вот скриншот рандомной статьи из википедии, в которую я попал, просто клацая по ссылкам на непонятном мне языке. Попробуй угадать хотя бы примерно о чем идет речь, исходя из иллюстрации.

persik 03-07-2016 23:09 0

vosmoi, Я тут тупанул.

Jotun 03-07-2016 23:13 0

persik, Ну, формально он определяет время создания пергамента и чернил, а не написания текста, что оставляет простор для упоротых теорий.

vosmoi 03-07-2016 23:20 +1

Jotun, Давай проведем эксперимент
Если бы у нас было еще было сотню таких статей, явно объединенных в одну тематику, то мы бы смогли выловить повторения слов и понять их смысл. Мы бы нашли, например, что у стальных строений почти всегда повторяется одно слово, которое бы предположительно означало "металлическое". Это грубый пример, но принцип был бы похожим.

Jotun 03-07-2016 23:20 0

persik, Надо запретить редактировать комментарии, на которые кто-то уже ответил :)

Jotun 03-07-2016 23:22 0

vosmoi, Так тут в чем соль: вот у нас есть тематика. Есть словарь повторяющихся слов, которые встречаются на страницах данной тематики. Мы даже так или иначе можем определить их части речи (возможно).
Но тематика, которая у нас есть, включает в себя растения, фармакологию, алхимию и хрен его знает, что ещё, и набор слов, которые могут повторяться в таких текстах становится критически огромным, что не позволяет дешифровать его комбинаторным путём.

vosmoi 03-07-2016 23:28 +2

Jotun, тематика, которая у нас есть, включает в себя растения, фармакологию, алхимию и хрен его знает, что ещё, и набор
Разделы же не перемешаны, они следуют друг за другом, поэтому пофиг.

Вообще, ты серьезно считаешь, что спецы которые ломали шифры второй мировой войны и современные ученые, не смогли найти ключи к пониманию этой книги? Вероятнее то, что ключей нет, чем то, что они бы не разобрались. Это мы тут лохи строим предположения, а у них вся жизнь посвящена дешифровке.

Jotun 03-07-2016 23:31 0

vosmoi, Вообще, ты серьезно считаешь, что спецы которые ломали шифры второй мировой войны и современные ученые, не смогли найти ключи к пониманию этой книги?
Эм, шифры второй мировой шифровали сообщения, написанные естественным языком и намеренно зашифрованные, это немного другое все же.

Разделы же не перемешаны, они следуют друг за другом, поэтому пофиг.
Если ты внимательно читал, ты мог заметить, что там на самом деле нет никаких разделов. Просто рукопись условно разделили на части, которым присвоили названия, отдаленно соответствующие содержимому иллюстраций. Так что тематика (особенно, если вспомнить про общий оккультный оттенок ма*ускрипта) может сильно разниться, если не считать, пожалуй, ботанического раздела, да.

persik 04-07-2016 00:02 0

Jotun, Я там проглядел ключевые слова, потому что прочитал по диагонали.

Simple_Not 04-07-2016 01:32 +1

vosmoi, Тем не менее даже лучшие дешифровщики не осилили взломать тех же навахо, которые просто вели эфир на своём языке.
Наличие текста вообще не особо спасает. Сам по себе текст ну очень редко раскрывает хоть какую-то семантику, если он не идеографический. Основной способ дешифровки непонятных старых письмен - это нахождение цельной билингвы, либо перевода на другой текст, записи того же текста другой письменностью.