Преобразование текста в формат вики

From SysadminWiki.ru
Jump to: navigation, search

Небольшие фрагменты текста с малым форматированием легче сразу скопировать в окно редактора на вики сайте и отформатировать вручную. Со временем, когда символы и теги форматирования вики не будут резать глаза, этот способ окажется самым лёгким. Справка по редактированию этого сайта даст полезные советы и ссылки на эту тему.

Подготовка материала

Для больших текстов удобней сначала обработать документ специальными конвертерами. Рекомендую использовать конвертер для LibreOffice (OpenOffice), т.к. получаемый им текст содержит более чистую разметку (меньше управляющих тэгов).


LibreOffice

Для экспорта текста в формат MediaWiki в LibreOffice можно использовать следующие расширения.

Sun Wiki Publisher

В некоторых сборках LibreOffice уже добавлен. Можно скачать с сайта OpenOffice.

В Ubuntu можно установить командой:

sudo apt install libreoffice-wiki-publisher

Экспорт делается с помощью меню:

Файл -- Экспорт -- Формат: MediaWiki (.txt)

Расширение требует Java, не обновляется с 2008 года, но в LibreOffice 6 работает и в нём реализовано многое из разметки вики.

Writer2Wiki

Умеет сопоставлять стили LibreOffice шаблонам MediaWiki, использует тэг <span> для более точной передачи оформления. Для сопоставления стилей создаёт в текущем каталоге файл wiki-styles.txt. Подрбнее в описании на английском.

Установка

1. Можно скачать собранное OXT расширение, которое достаточно распаковать и запустить, или

2. Скачать с официальной страничке на GitHub. Для установки достаточно скопировать каталог расширения (если скачен архив, то нужно распаковать) в папку с питоновскими скриптами:

[Папка установки LibreOffice]/share/Scripts/python

Расширение не требует дополнительного ПО, т.к. написано на Питоне, который входит в дистрибутив LibreOffice.

Экспорт делается с помощью меню:

Сервис -- Дополнения -- Экспортировать в Wiki-текст


MS Office

Алгоритм переноса текста

Теперь, чтобы воспользоваться конвертером

  1. выделяем нужную часть (главу)
  2. копируем в новый (пустой) документ: Файл - Создать - Текстовый документ
  3. экспортируем новый файл в текстовый файл вики формата
  4. открываем текстовый файл в текстовом редакторе по умолчанию (дважды щёлкаем мышью по файлу)
  5. делаем (если необходимо) ручную доработку текста
  6. копируем текст в окно редактирования вики сайта


Обработка после конвертера

Есть один нюанс при работе с конвертерами вики текста: они не всегда правильно преобразуют форматирование. Поэтому после того как текст сконвертирован полезно перед сохранением статьи сделать предварительный просмотр.

Несмотря на то, что конвертер OpenOffice выдаёт довольно чистый текст с хорошим форматированием, тем не менее выдаваемый им текст стоит просмотреть на наличие:

  • Избыточного форматирования таблицы. Конвертер описывает вид каждой ячейки, что сильно загромождает текст. В большинстве случаев достаточно указать '''{| class="wikitable sortable"''' и убрать всё остальное форматирование
  • Лишних тэгов <nowiki></nowiki>, которые, например, ставятся, если в тексте встречаются квадратные скобки "[]"
  • Лишних тэгов <sup></sup>, которые добавляются к сноскам (тэг <ref>)

Удалять лишнее форматирование проще всего в каком-нибудь простом текстовом редакторе с помощью команды Замена, указав в качестве замены пустое поле. После изменений можно скопировать новый текст обратно в окно редактирования вики и сделать предварительный просмотр.

Организация материала

  • Вики статьи лучше не делать большими, чтобы не вызвать конфликты при одновременной правке несколькими людьми. Текст лучше разбивать на логические блоки (фрагменты), например, главы, части, разделы. Лучше всего это делать на основе содержания.
  • Название статей должно отражать не только название главы, но и название книги, а лучше и автора. Это позволит обеспечить уникальность статьи, хоть и будет выглядеть громоздко. Например, название статьи строить так:
Имя Автора - Название Книги - Название Раздела - Название или Номер Главы
  • Чтобы после разбиения получить целостный текст, каждый фрагмент стоит поместить в категорию, название которой отражает название документа (книги) и положение фрагмента в содержании, по аналогии с названием статьи. Не стоит называть категории "Глава 1" или "Часть Первая", так как в другой книге (документе) вполне возможно также будет первая глава и оба фрагмента попадут в одну и ту же категорию. Например, для вышеуказанной статьи логично создать категорию:
[[Категория:Имя Автора - Название Книги - Название Раздела]]

В эту категорию нужно будет поместить все статьи из раздела Название Раздела. В свою очеред сам раздел Название Раздела поместить в категорию:

[[Категория:Имя Автора - Название Книги]]