Выбор кодировки текста при открытии и сохранении файлов. Журнал windows severity информация кракозябры
Выбор кодировки текста при открытии и сохранении файлов
Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо поделиться файлом с человеком, который работает с текстами на других языках, скачать текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.
Когда вы открываете текстовый файл в Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.
В этой статье
Выбор кодировки при открытии файла
Выбор кодировки при сохранении файла
Поиск кодировок, доступных в Word
Общие сведения о кодировке текста
Информация, которая выводится на экран в виде текста, на самом деле хранится в текстовом файле в виде числовых значений. Компьютер преобразует эти значения в отображаемые знаки, используя кодировку.
Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.
Различные кодировки для разных алфавитов
Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке "Кириллица (Windows)" знаку "Й" соответствует числовое значение 201. Когда вы открываете файл, содержащий этот знак, на компьютере, на котором используется кодировка "Кириллица (Windows)", компьютер считывает число 201 и выводит на экран знак "Й".
Однако если тот же файл открыть на компьютере, на котором по умолчанию используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в этой кодировке. Например, если на компьютере используется кодировка "Западноевропейская (Windows)", знак "Й" из исходного текстового файла на основе кириллицы будет отображен как "É", поскольку именно этому знаку соответствует число 201 в данной кодировке.
Юникод: единая кодировка для разных алфавитов
Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.
Так как Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).
К началу страницы
Выбор кодировки при открытии файла
Если в открытом файле текст искажен или выводится в виде вопросительных знаков либо квадратиков, возможно, Word неправильно определил кодировку. Вы можете указать кодировку, которую следует использовать для отображения (декодирования) текста.
Примечание: В Microsoft Office Word 2007 вместо первых двух действий нажмите кнопку Microsoft Office
, а затем выберите Параметры Word. Затем следуйте инструкциям ниже (щелкните Дополнительно).
-
Откройте вкладку Файл.
-
Выберите пункт Параметры.
-
Выберите пункт Дополнительно.
-
Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии.
Примечание: Если установлен этот флажок, Word отображает диалоговое окно Преобразование файла при каждом открытии файла в формате, отличном от формата Word (то есть файла, который не имеет расширения DOC, DOT, DOCX, DOCM, DOTX или DOTM). Если вы часто работаете с такими файлами, но вам обычно не требуется выбирать кодировку, не забудьте отключить этот параметр, чтобы это диалоговое окно не выводилось.
-
Закройте, а затем снова откройте файл.
-
В диалоговом окне Преобразование файла выберите пункт Кодированный текст.
-
В диалоговом окне Преобразование файла установите переключатель Другая и выберите нужную кодировку из списка.
В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Чтобы установить дополнительные шрифты, сделайте следующее:
-
Нажмите кнопку Пуск и выберите пункт Панель управления.
-
Выполните одно из указанных ниже действий.
В Windows 7
-
На панели управления выберите раздел Удаление программы.
-
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В Windows Vista
-
На панели управления выберите раздел Удаление программы.
-
В списке программ щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
В Windows XP
-
На панели управления щелкните элемент Установка и удаление программ.
-
В списке Установленные программы щелкните Microsoft Office или Microsoft Word, если он был установлен отдельно от пакета Microsoft Office, и нажмите кнопку Изменить.
-
-
В группе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты и затем нажмите кнопку Продолжить.
-
В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.
-
Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.
Совет: При открытии текстового файла в той или иной кодировке в Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем щелкните Параметры Word и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.
К началу страницы
Выбор кодировки при сохранении файла
Если не выбрать кодировку при сохранении файла, будет использоваться Юникод. Как правило, рекомендуется применять Юникод, так как он поддерживает большинство символов большинства языков.
Если документ планируется открывать в программе, которая не поддерживает Юникод, вы можете выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на китайском (традиционное письмо) с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке "Китайская традиционная (Big5)". В результате текст будет отображаться правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).
Примечание: Так как Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, например, что документ в Юникоде содержит текст на иврите и языке с кириллицей. Если сохранить файл в кодировке "Кириллица (Windows)", текст на иврите не отобразится, а если сохранить его в кодировке "Иврит (Windows)", то не будет отображаться кириллический текст.
Если выбрать стандарт кодировки, который не поддерживает некоторые символы в файле, Word пометит их красным. Вы можете просмотреть текст в выбранной кодировке перед сохранением файла.
При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт Symbol, а также коды полей.
Выбор кодировки
-
Перейдите на вкладку Файл или (в Word 2007) нажмите кнопку Microsoft Office
. -
Нажмите кнопку Сохранить как.
Чтобы сохранить файл в другой папке, найдите и откройте ее.
-
В поле Имя файла введите имя нового файла.
-
В поле Тип файла выберите Обычный текст.
-
Нажмите кнопку Сохранить.
-
Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.
-
В диалоговом окне Преобразование файла выберите подходящую кодировку.
-
Чтобы использовать стандартную кодировку, выберите параметр Windows (по умолчанию).
-
Чтобы использовать кодировку MS-DOS, выберите параметр MS-DOS.
-
Чтобы задать другую кодировку, установите переключатель Другая и выберите нужный пункт в списке. В области Образец можно просмотреть текст и проверить, правильно ли он отображается в выбранной кодировке.
Примечание: Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.
-
-
Если появилось сообщение "Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке", можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.
Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.
Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).
-
Если документ будет открываться в программе, в которой текст не переносится с одной строки на другую, вы можете включить в нем жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите нужное обозначение разрыва (возврат каретки (CR), перевод строки (LF) или оба значения) в поле Завершать строки.
К началу страницы
Поиск кодировок, доступных в Word
Word распознает несколько кодировок и поддерживает кодировки, которые входят в состав системного программного обеспечения.
|
Система письменности |
Кодировки |
Используемый шрифт |
|
Многоязычная |
Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7) |
Стандартный шрифт для стиля "Обычный" локализованной версии Word |
|
Арабская |
Windows 1256, ASMO 708 |
Courier New |
|
Китайская (упрощенное письмо) |
GB2312, GBK, EUC-CN, ISO-2022-CN, HZ |
SimSun |
|
Китайская (традиционное письмо) |
BIG5, EUC-TW, ISO-2022-TW |
MingLiU |
|
Кириллица |
Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866 |
Courier New |
|
Английская, западноевропейская и другие, основанные на латинице |
Windows 1250, 1252-1254, 1257, ISO8859-x |
Courier New |
|
Греческая |
Windows 1253 |
Courier New |
|
Иврит |
Windows 1255 |
Courier New |
|
Японская |
Shift-JIS, ISO-2022-JP (JIS), EUC-JP |
MS Mincho |
|
Корейская |
Wansung, Johab, ISO-2022-KR, EUC-KR |
Malgun Gothic |
|
Тайская |
Windows 874 |
Tahoma |
|
Вьетнамская |
Windows 1258 |
Courier New |
|
Индийские: тамильская |
ISCII 57004 |
Latha |
|
Индийские: непальская |
ISCII 57002 (деванагари) |
Mangal |
|
Индийские: конкани |
ISCII 57002 (деванагари) |
Mangal |
|
Индийские: хинди |
ISCII 57002 (деванагари) |
Mangal |
|
Индийские: ассамская |
ISCII 57006 |
|
|
Индийские: бенгальская |
ISCII 57003 |
|
|
Индийские: гуджарати |
ISCII 57010 |
|
|
Индийские: каннада |
ISCII 57008 |
|
|
Индийские: малаялам |
ISCII 57009 |
|
|
Индийские: ория |
ISCII 57007 |
|
|
Индийские: маратхи |
ISCII 57002 (деванагари) |
|
|
Индийские: панджаби |
ISCII 57011 |
|
|
Индийские: санскрит |
ISCII 57002 (деванагари) |
|
|
Индийские: телугу |
ISCII 57005 |
-
Для использования индийских языков необходима их поддержка в операционной системе и наличие соответствующих шрифтов OpenType.
-
Для непальского, ассамского, бенгальского, гуджарати, малаялам и ория доступна только ограниченная поддержка.
К началу страницы
support.office.com
Кракозябры и знаки вопроса или неверная кодировка - Дневник злостного критика-рецидивиста
Да-да. Как это ни печально, в эру UNICODE у меня снова всталвопрос с кракозябрами или знаками вопроса вместо русских букв.Обнаружилось, что все мои программы с русскоязычным интерфейсрм, написанные на Delphi 7, при отображении их в англоязычных операционных системах вместо русских букв отображают знаки вопроса. Скажу сразу, перевод проектов под UNICODE-совместимую версию Дельфи (2009 или 2010) практически не представляется возможным, поскольку в этих проектах использованы компоненты, не имеющие новых UNICODE-совместимых версий (поддержка компонентов авторами больше не осуществляется).
Странно не то, что интерфейс программ не отображает русских букв, а то, что вместо ожидаемых кракозябр отображаются знаки вопроса. Кракозябры - это не что иное, как символы текущей кодировки, имеющие коды, совпадающие с кодами русских букв в русской кодировке, и их появление вполне ожидаемо. Знаки вопроса же обычно возникают в том случае, когда система не может сопоставить использованный национальный символ UNICODE (например, русскую букву из UNICODE) с символом текущей кодировки (например, 1252, где похожих символов просто нет). Но у меня Юникодом и не пахнет нигде, у меня в интерфейсе изначально идёт кодировка 1251, которая в англоязычной кодировке 1252 должна отображаться кракозябрами! Очевидно, где-то в операционной системе происходит двойное преобразование по цепочке 1251 - UNICODE - 1252.
Операционная система Windows XP, Windows Vista и Windows 7 имеют специальную настройку локалей. Располагается она на Панели Управления, и называется "Язык и национальные стандарты". Там, на последней вкладке (вкладка "Дополнительно") можно выбрать язык для программ, не поддерживающих Юникод. По идее, после установки там русского языка, программа должна отображать русские буквы правильно. На деле же происходит отображение русских букв только в шапке программы и в компонентах ColorBox. Во всех остальных компонентах интерфейса остаются знаки вопроса.
Удивительно, но проблему решает совершенно другая настройка, а именно "Региональные параметры" (первая вкладка окна "Язык и региональные параметры"). Вообще-то эта вкладка отвечает за форматы выводимых чисел, денежных единиц, даты и времени, и какое отношение она имеет к кодировкам - непонятно. Тем не менее, если установить на ней значение "Русский (Россия)", знаки вопроса пропадают, и система начинает вести себя так, как положено, то есть интерфейс программы начинает отображать либо кракозябры, либо русские буквы в зависимости от настройки локали на вкладке "Дополнительно".
Вот такие результаты дают разные комбинации этих двух настроек в любой версии операционной системе Windows, начиная с версии Windows XP:
Формат: СШАЛокаль: СШАРезультат: Везде знаки вопроса Формат: СШАЛокаль: РоссияРезультат: Везде знаки вопроса, кроме шапки и колорбоксов, в которых отображаются русские символы Формат: РоссияЛокаль: СШАРезультат: Везде "кракозябры" Формат: РоссияЛокаль: РоссияРезультат: Всё ОК!
Резюмируя вышесказанное, формулирую следующие непонятные мне вопросы:
- Почему на англоязычных компьютерах в интерфейсе русскоязычных программ, использующих однобайтовую кодировку, вместо кракозябр возникают знаки вопроса? Появляются ли они из-за возникновения цепочки преобразований 1251 - UNICODE - 1252, и если да, то почему, и как этого избежать?
- Почему при переключении локали на последней вкладке, знаки вопроса превращаются в русские символы только в шапке программы и в компоненте ColorBox? В чём разница между этими и всеми остальным компонентами?
- Почему на появление знаков вопроса влияет первая вкладка, отвечающая за формат выводимых чисел и дат? Можно ли решить вопрос, оставив формат отображения чисел и дат англоязычным, без нудной подгонки русского формата под англоязычный в дополнительных настройках?
P.S.: Я выявил все форматы, при которых кириллица отображается нормально:
Азербайджанский (кириллица)Амхарский (Эфиопия)Армянский (Армения)Ассамский (Индия)Башкирский (Россия)Белорусский (Беларусь)Бенгальский (Бангладеш)Бенгальский (Индия)Болгарский (Болгария)Боснийский (кириллица)Грузинский (Грузия)Гуджарати (Индия)Дивихай (Мальдивы)Инуктитут (слоговое письмо, Канада)Казахский (Казахстан)Каннада (Индия)Киргизский (Киргизстан)Конкани (Индия)Кхмерский (Комбоджа)Лаосский (ЛНДР)Македонский (БЮР Македония)Малаялам (Индия)Мальтийский (Мальта)Маори (Новая Зеландия)Маратхи (Индия)Монгольский (традиционный монгольский, КНР)Монгольский (кириллица, Монголия)Непальский (Непал)Ория (Индия)Панджаби (Индия)Пашто (Афганистан)Русский (Россия)Санскрит (Индия)Сербский (кириллица)Сингальский (Шри-Ланка)Сирийский (Сирия)Таджикский (кириллица, Таджикистан)Тамильский (Индия)Татарский (Россия)Телугу (Индия)Тибетский (КНР)Узбекский (кириллица, Узбекистан)Украинский (Украина)Хинди (Индия)Юи (КНР)Якутский (Россия)
Во всех остальных форматах, коих намного больше, возникают знаки вопроса. Отсюда дополнительный вопрос, что общего с точки зрения настроек операционной системы между всеми этими языками?
Кстати, 4 формата дали ещё один интересный результат:
Китайский (упрощённое письмо, КНР) и Китайский (упрощённое письмо, Сингапур) дали знаки параграфа §, чередующиеся с символами кириллицы.Корейский (Корея) дал знаки ¬ чередующиеся с символами кириллицы.Японский (Япония) дали знаки ˷ чередующиеся с символами кириллицы.
Так что вот дополнительная пища для размышлений.
novikovmaxim.livejournal.com
Исправление ошибок кодировки в Windows
Меняем системные файлы. А если точнее, то мы не будем их менять, а лишь переименуем, чтобы до системы дошло наконец что мы хотим.
Первым делом идём по пути C:\Windows\System32 и листаем вниз в поисках следующих файлов:C_1250.NLSC_1252.NLSC_1253.NLSC_1254.NLSC_1255.NLS Нашли? Отлично. Теперь переименовываем их. Лучше будет просто добавить к названию что-то, например .bak. Здесь есть небольшая загвоздка, заключающаяся в том, что это системные файлы Windows, и ОС не даст Вам вот так просто переименовать их. Для этого нужно находиться под учетной записью администратора. Если уж совсем не получается, то кликаем правой кнопкой мыши по файлу и выбираем пункт Свойства. В окне свойств выбираем вкладку Безопасность и жмем кнопку Дополнительно.В этом окне есть вкладка Разрешения и в ней выбираем Администратора, затем жмём кнопку Изменить разрешения
Следующее окно будет почти таким же, только там есть кнопка Изменить. Жмем её
Если в списке нет Администратора, то добавьте его через кнопку Добавить.
Вот и добрались до нужного нам окна. Здесь нужно поставить галочку напротив Полного доступа, а можете и вообще все галочки поставить
Всё. Теперь можете переименовать файл. И так делается со всеми файлами.
6.1 Далее что нам нужно сделать, после того как переименовали файлы, это скопировать файл C_1251.NLS в какую-нибудь папку или место. Это самый нужный файл, который как раз и отвечает за русскую кодировку.
6.2 Теперь этот файл переименовываем как C_1252.NLS, копируем и вставляем в папку System32.
6.3 В принципе можно на этом уже и закончить, но если начали, то давайте делать до конца. А это значит что нужно вновь переименовать тот файл, который скопировали в папку (первоначально он был C_1251.NLS, а сейчас C_1252.NLS), на C_1250.NLS и потом его снова вставить в System32.Затем всё это повторяем для других файлов, переименовывая и вставляя C_1253.NLS, C_1254.NLS и C_1255.NLS в папку system32.
Не запутались? Может быть…
В итоге в папке C:\Windows\System32 у Вас должно быть так:
Надеюсь доступно объяснил… Если проще, то мы просто берем файл C_1251.NLS и переименовываем его в другие, перед этим те самые другие переименовав, чтобы не было конфликтов в названии.Вот как то так…
sbgames.su
Кракозябры в Windows 10
После установки операционной системы Windows 10 пользователи могут столкнуться с такой проблемой, как отображение кракозябров или иероглифов в интерфейсе системы, программах и даже в документах. Причиной такой неполадки может быть неправильная настройка региональных стандартов, а также использование не лицензионной системы. Поэтому, если вы столкнулись с данного рода неполадкой, стоит ознакомиться со способами её решения.
Читайте также: Неправильные разрешения для каталогов службы поиска в Windows 10
Настройка региональных стандартов как способ решения проблемы
Если после установки или обновления операционной системы Windows 10 все программы и документы стали отображаться иероглифами, стоит выполнить следующие действия:
- Нажимаем правой кнопкой мыши на значке «Пуск» и выбираем «Панель управления».
- Откроется новое окно. Выбираем раздел «Региональные стандарты».
- Появится небольшое окно. Переходим во вкладку «Дополнительно» и в разделе «Язык программ, не поддерживающих Юникод» нажимаем «Изменить язык системы».
- Выбираем русский язык. Сохраняем изменения.
После перезагрузки операционной системы изменения вступят в силу и кракозябры исчезнут.
softikbox.com
Кракозябры вместо букв
Несколько раз мне доводилось сталкиваться с вопросами вроде: «я установил программу Х на мой компьютер, но при запуске все ее меню и названия кнопок в каких-то непонятных символах — абракадабра!»
Да, такое иногда встречается и среди пользователей подобные нечитаемые символ получили прозвище «кракозябры». Как правило, если эту же программу установить на другом компьютере, то все будет работать как надо и меню будет отображаться на русском языке.
Отчего же так происходит?
Дело в том, что в Windows есть так называемая кодовая страница, которая определяет, какие символы операционная система поддерживает. Есть несколько кодировок символов и не все разработчики программ используют кодировку Unicode (Юникод). Именно такие программы обычно и отображаются некорректно.
К тому же я почти уверен, что если вы столкнулись с подобной проблемой, то на вашем компьютере установлена не русскоязычная версия Windows, то есть сам интерфейс операционной системы на каком-то другом языке. Но то что язык интерфейса Windows не на русском еще не означает, что и интерфейс других программ должен быть на этом же языке. При установке Windows были выставлены некоторые параметры, которые нам нужно изменить и другие программы будут отображаться корректно.
Делается это просто — через Панель управления Windows. Заходим в Панель управления и находим раздел «Язык и региональные стандарты»:
Переходим на вкладку «Дополнительно» и обращаемся к блоку «Язык программ, не поддерживающих Юникод»:
В этом разделе должен быть установлен русский язык. Если это не так, нажимаем на кнопку «Изменить язык системы…», выбираем русский и после этого перегружаем компьютер.
Прошу не путать — кнопка «Изменить язык системы...» не поменяет язык интерфейса Windows. Она лишь позволит операционной системе правильно отображать программы, использующие другую кодировку символов!
После перезагрузки компьютера «абракадабра» вместе с «кракозябрами» исчезнут и все меню программы будут на русском языке.
pcsecrets.ru
Кракозябры в Windows вместо букв
Наверное многим из вас приходилось сталкиваться с вот таким корявым переводом программ в Windows.
Noaoenoeea?aaeno?aoeyAeaaiayEiioaeou
Это обычная ошибка русификации программы из за кривого русификатора или его некорректной установки. Это символы языков с надстрочными знаками.
Как исправить кракозябры в Windows
Идем в редактор реестра: меню Пуск -> Выполнить ->В окошке пишем regedit
HKEY_LOCAL_MACHINE -> system -> CurrentControlSet -> Control -> Nls -> CodePage

Находим параметр 1252 и делаем по нему двойной щелчок

Теперь меняем значение параметра с с_1252.nls на с_1251.nls

Перезагружаем компьютер и проверяем все ли в порядке. Что бы и в дальнейшем не было проблем с софтом, от греха подальше меняем значения параметров с 1250 по 1255 на 1251.
http://winblogs.ru/problemm/zabr.html2017-07-19T06:06:20+00:00ПроблемыНаверное многим из вас приходилось сталкиваться с вот таким корявым переводом программ в Windows. Noaoenoeea ?aaeno?aoey Aeaaiay Eiioaeou Это обычная ошибка русификации программы из за кривого русификатора или его некорректной установки. Это символы языков с надстрочными знаками. Как исправить кракозябры в Windows Идем в редактор реестра: меню Пуск -> Выполнить -> В окошке пишем regedit HKEY_LOCAL_MACHINE ->... Userwinblogs.ru - Компьютер для чайниковwinblogs.ru






