Обозначение специальных символов текста в кодировке UTF-8.
Файл XDG_DATA_DIRS/zim/symbols.list содержит спецификацию специальных символов, используемых в тексте блокнота.
Несмотря на то, что при установке приложения Zim в файле symbols.list уже содержится набор спецсимволов, пользователь может изменить (реорганизовать, дополнить, сократить) имеющийся набор в соответствии с областью собственной практической деятельности.
При изменении содержания файла symbols.list следует придерживаться следующих правил:
Описание каждого специального символа приводить отдельной строкой.
Структура записи: «ключ» табуляция или пробел «значение».
Ключом служит сокращение, начинающееся обратной косой чертой (\).
Значением служит десятичное значение символа в Юникоде (Unicode), присутствующее в кодировке UTF-8.
Например: строка для знака авторского права (©) выглядит следующим образом:
\copy 169
сокращение «\copy» можно использовать в гипертексте на странице блокнота для отображения знака авторского права;
«169» является десятичным значением символа в Юникоде (Unicode).
Юникод (Unicode) — универсальный набор символов, в котором определены все символы, пунктуация и условные обозначения (пиктограммы), позволяющие создавать, хранить и передавать текст. Каждому символу присвоен цифровой (десятичный) идентификатор. Юникод позволяет переводить цифровые идентификаторы в символы и обратно. Например,
65 A;
66 B;
67 C;
68 D.
Стандарт символов Юникод (Unicode) применяется в операционных системах, базах данных, языках программирования, электропочте, языках разметки публикаций (HTML, XML).
Стандарт символов Юникод (Unicode) содержит различные наборы символов, называемые кодировка. Самые общеупотребительные кодировки:
UTF-8 — предпочтительная кодировка для электропочты и публикаций в интернете.
UTF-16 — предпочтительная кодировка для операционных систем.
Кодировка позволяет транслировать цифровой идентификатор в двоичное значение символа. Например, восьмизначная кодировка UTF-8 выглядит следующим образом:
65 1000001;
66 1000010;
67 1000011;
68 1000100.
Как отмечено выше для публикаций в интернете предпочтительно применять кодировку UTF-8. Ниже приводятся группы символов принятые в кодировке UTF-8:
блоковые элементы;
геометрические фигуры;
технические знаки;
Пользователю следует выбрать требуемую группу символов и вставить её в файл XDG_DATA_DIRS/zim/symbols.list.