Ответ 1
Out-File
имеет кодировку по умолчанию, если не переопределить параметр -Encoding
:
То, что я сделал для решения этой проблемы, - попытаться получить исходную кодировку файла, прочитав ее, прочитав ее размер байта и используя это как значение параметра -Encoding
.
Здесь приведен пример обработки пучков текстовых файлов, получения исходной кодировки, обработки содержимого и записи его обратно в файл с исходной кодировкой.
function Get-FileEncoding {
param ( [string] $FilePath )
[byte[]] $byte = get-content -Encoding byte -ReadCount 4 -TotalCount 4 -Path $FilePath
if ( $byte[0] -eq 0xef -and $byte[1] -eq 0xbb -and $byte[2] -eq 0xbf )
{ $encoding = 'UTF8' }
elseif ($byte[0] -eq 0xfe -and $byte[1] -eq 0xff)
{ $encoding = 'BigEndianUnicode' }
elseif ($byte[0] -eq 0xff -and $byte[1] -eq 0xfe)
{ $encoding = 'Unicode' }
elseif ($byte[0] -eq 0 -and $byte[1] -eq 0 -and $byte[2] -eq 0xfe -and $byte[3] -eq 0xff)
{ $encoding = 'UTF32' }
elseif ($byte[0] -eq 0x2b -and $byte[1] -eq 0x2f -and $byte[2] -eq 0x76)
{ $encoding = 'UTF7'}
else
{ $encoding = 'ASCII' }
return $encoding
}
foreach ($textFile in $textFiles) {
$encoding = Get-FileEncoding $textFile
$content = Get-Content -Encoding $encoding
# Process content here...
$content | Set-Content -Path $textFile -Encoding $encoding
}
Обновление. Вот пример получения исходной кодировки файла с использованием класса StreamReader. В примере читаются первые 3 байта файла, так что свойство CurrentEncoding
устанавливается на основе результата его внутренней процедуры определения спецификации.
http://msdn.microsoft.com/en-us/library/9y86s1a9.aspx
Параметр detectEncodingFromByteOrderMarks определяет кодировку по глядя на первые три байта потока. Это автоматически распознает UTF-8, малоконечный Unicode и текст в формате Юникод в формате big-endian если файл начинается с соответствующих знаков порядка байтов. В противном случае, используется кодировка UTF8Encoding. См. Метод Encoding.GetPreamble для получения дополнительной информации. информация.
http://msdn.microsoft.com/en-us/library/system.text.encoding.getpreamble.aspx
$text = @"
This is
my text file
contents.
"@
#Create text file.
[IO.File]::WriteAllText($filePath, $text, [System.Text.Encoding]::BigEndianUnicode)
#Create a stream reader to get the file encoding and contents.
$sr = New-Object System.IO.StreamReader($filePath, $true)
[char[]] $buffer = new-object char[] 3
$sr.Read($buffer, 0, 3)
$encoding = $sr.CurrentEncoding
$sr.Close()
#Show the detected encoding.
$encoding
#Update the file contents.
$content = [IO.File]::ReadAllText($filePath, $encoding)
$content2 = $content -replace "my" , "your"
#Save the updated contents to file.
[IO.File]::WriteAllText($filePath, $content2, $encoding)
#Display the result.
Get-Content $filePath