Кодировка символов Eclipse
Я использую Scanner для сканирования документа .txt в Java. Однако, когда я открываю документ .txt в Eclipse, я замечаю, что некоторые символы не распознаются, и они заменяются тем, что выглядит следующим образом:
Эти символы даже не позволяют мне сканировать файл как
while(scan.hasNext)
автоматически возвращает false (если эти символы не присутствуют, то я могу полностью проверить документ).
Итак, как мне заставить Eclipse распознавать эти символы, чтобы я мог сканировать? Я не могу удалить их вручную, потому что документ довольно большой.
Спасибо.
Ответы
Ответ 1
Файл, который вы читаете, должен содержать UTF-8 или некоторые другие символы кодировки, и когда вы пытаетесь распечатать их на консоли, вы получите некоторые символы как '. Это связано с тем, что стандартная консольная кодировка не является UTF-8 в eclipse. Вам необходимо установить его, выбрав "Выполнить конфигурацию" → "Общие" → "Кодировка" → "Выбрать UTF-8" из раскрывающегося списка. Проверьте снимок экрана:
![enter image description here]()
Ответ 2
Если вам нужно изменить кодировку символов для всей рабочей области Eclipse, перейдите в Window → Preferences.
Затем в разделе General → Workspace измените "кодировку текстового файла" на соответствующую кодировку символов (в данном случае UTF-8).
![Eclipse Preferences - Changing Character Encoding]()