Что такое текстологическая работа и зачем она нужна

2021-03-15 Заря

Что такое текстологическая работа и зачем она нужна

Источник: Заряopen in new window

Недавно наше сообщество объявило о начале текстологической работы над наследием Н. Г. Чернышевского и В. И. Ленина. Мы написали статьюopen in new window с подробным обоснованием того, почему мы считаем эту работу необходимой и своевременной. Хотя, судя по имеющимся у нас сообщениям, текстология является важной частью деятельности зарубежных освободительных сообществ, в русскоязычном пространстве об этой деятельности известно немного. Целью этой статьи является краткое изложение сути и цели текстологии.

Цель нашей текстологической работы - получить тщательно выверенную и подходящую для дальнейшего изучения версию авторского текста. Здесь сразу могут возникнуть вопросы: выверенную как? Для какого изучения? Разве того, что сделано советскими специалистами не хватает? Во-первых, оговоримся, что работа основывается на имеющихся советских изданиях текстов. Делать заново нет ни возможности, ни необходимости. Советская текстология проделала монументальную работу по созданию корпуса текстов и классиков марксизма-ленинизма, и авторов множества других областей. Любой, кто когда-нибудь перебирал вещи своих дедушек знает, что никакого дефицита книг тогда не было. Но тут мы сталкиваемся с первой проблемой: СССР больше нет. Старые издания если и переиздаются, то под новой обложкой и в урезанном виде, к тому-же ограниченным тиражом.

Самоотверженные люди и сообщества занимаются оцифровкой. Результатом этого труда являются десятки тысяч отсканированных книг и журналов доступных в интернете. Большинство файлов доступно в форматах pdf или djvu. Эти форматы получаются в результате фотографирования отдельных страниц и их дальнейшего «склеивания» в один файл. Иногда поверх картинки добавляется текст, созданный специальной программой распознавателем, который, впрочем, редко бывает сносного качества. Любой, кто читал такие книги знает, что в них есть масса неудобств - трудный или вовсе невозможный перенос книги в электронные читалки, невозможность поиска по словам и копирования отдельных частей текста, плохое отображение, большой объём занимаемой памяти и т. д. и т. п. Именно по этим причинам зачастую после оцифровки делается следующий шаг - автоматическое распознавание текста из картинки. В результате распознания мы работаем уже не с картинкой, а с текстом. В зависимости от разных причин получаемый текст содержит большее или меньшее количество ошибок и неточностей. Обработав текст выбранным языком разметки, получается гипертекст, кратно расширяющий возможности работы с текстом.

undefined

В этом и заключается цель нашей текстологической выверки. Тексты полного собрания сочинений Ленина и Чернышевского 1) выверяются на предмет грамматических, орфографических и других ошибок, допущенных при распознавании 2) внутри текста проводится разметка, отражающая разметку автора и облегчающая дальнейшую машинную обработку текста. Важно понять, что, говоря о разметке текста, мы не говорим о конечном отображении текста. Например, в старых текстах часто встречается приём выделения текста, называемый разрядкойopen in new window. Встречая в тексте слова, выделенные разрядкой, в гипертексте мы их обозначаем некой «меткой» или тегом. В дальнейшем, в зависимости от используемого формата отображения, эти метки могут быть автоматически изменены на любые необходимые. Таким образом из единожды выверенного гипертекста мы можем автоматически получать любые нужные нам форматы. Примером такой системы является наш каталог книгopen in new window, который позволяет скачать книгу в удобной для пользователя формате.

undefined

Но не стоит думать, что вся работа затеяна лишь ради повышения уровня комфорта. Дополнительное удобство в работе с текстами классиков это, можно сказать, побочный эффект. Более важная цель заключается в повышении доступности наследия величайших русских мыслителей для мирового коммунистического сообщества. Здесь мы подошли к пункту изучения работ классиков. Русскоговорящим людям, живущим на территории бывшего СССР, легко забыть, что народам других стран и носителям других языков с текстами того же Ленина повезло несравненно меньше. Не раз представители зарубежных групп освобождения обращаясьopen in new window к российским товарищам указывали, что мы должны сделать эти тексты легкодоступными для каждого желающего. И здесь с ними трудно не согласиться. Давайте вспомним, чем занимались освободительные движения Европы и России с середины 19-ого века. Коммунисты (в том числе, как известно, и Карл Маркс, и Фридрих Энгельс) всячески способствовали распространению своих работ везде, в том числе и в России. А первые кружки социал-демократов в Российской Империи плотно занимались переводом работ своих «более опытных» коллег. Это замечательная иллюстрация сути пролетарского движения - оно интернационально по определению, и замыкание внутри своего языкового и территориального пространства для такого движения подобно смерти.

Подготовка корпуса гипертекстов Ленина и Чернышевского является прологом к присоединению этих текстов к международной базе данных. Более опытные в этом плане текстологи Европы и других стран высказывалисьopen in new window на эту тему. Если вкратце изложить их видение - мы должны получить реляционную базу данных, позволяющую при необходимости сверять тексты на разных языках с оригиналом. Для этой цели требуется дополнительная обработка текста - разбивка на абзацы, метаданные абзаца и т. п. технические моменты. Результатом этой работы должна стать система, в которой любой желающий сможет сверить имеющийся у него перевод с оригиналом текста Ленина или Чернышевского. Если же перевода на нужный язык нет, такая база данных будет отличным исходником для переводчиков других стран.

Помимо толчка в распространении наследия великих русских мыслителей в мире, текстологическая работа, на наш взгляд, несёт в себе те зёрна организации, о которой так часто говорится в кругах, сочувствующих коммунизму. В процессе вычитки, заново знакомясь и обсуждая теоретические взгляды наших предшественников, мы в первую очередь переоткроем их для себя. Невозможно преодолеть проблемы нашего времени, если мы не знаем и не понимаем, как подобные проблемы решались нашими предшественниками. Поставив перед собой такую цель, цель преодоления теоретической раздробленности посредством открытой полемики, мы посадим зёрна будущей организации противников разделения труда. А работа для достижения общей цели является стержнем любого коллектива. Длительная совместная деятельность будет способствовать установлению деловых связей между индивидами и сообществами. А это именно то, чего нам сегодня катастрофически не хватает.

Последниее изменение: