标签: memory - 叹为观止

内存诊断与监控

# 当前进程内存信息
$proc = Get-Process -Id $PID
Write-Host "PowerShell 进程内存分析" -ForegroundColor Cyan
Write-Host "  工作集 (Working Set):    $([math]::Round($proc.WorkingSet64 / 1MB, 2)) MB"
Write-Host "  专用字节 (Private Bytes): $([math]::Round($proc.PrivateMemorySize64 / 1MB, 2)) MB"
Write-Host "  虚拟内存:                $([math]::Round($proc.VirtualMemorySize64 / 1MB, 2)) MB"
Write-Host "  句柄数:                  $($proc.HandleCount)"
Write-Host "  线程数:                  $($proc.Threads.Count)"

# .NET CLR 内存统计
$heap = [GC]::GetTotalMemory($false)
Write-Host "`n.NET 堆内存：$([math]::Round($heap / 1MB, 2)) MB" -ForegroundColor Yellow

# GC 代数统计
Write-Host "`nGC 代数回收次数：" -ForegroundColor Cyan
Write-Host "  Gen 0: $([GC]::CollectionCount(0))"
Write-Host "  Gen 1: $([GC]::CollectionCount(1))"
Write-Host "  Gen 2: $([GC]::CollectionCount(2))"

# 内存消耗函数
function Measure-ScriptMemory {
    param([scriptblock]$ScriptBlock, [string]$Label = "Test")

    [GC]::Collect()
    [GC]::WaitForPendingFinalizers()
    $before = [GC]::GetTotalMemory($true)

    $sw = [System.Diagnostics.Stopwatch]::StartNew()
    & $ScriptBlock
    $sw.Stop()

    $after = [GC]::GetTotalMemory($false)
    $diff = $after - $before

    [PSCustomObject]@{
        Label     = $Label
        BeforeMB  = [math]::Round($before / 1MB, 2)
        AfterMB   = [math]::Round($after / 1MB, 2)
        DeltaMB   = [math]::Round($diff / 1MB, 2)
        TimeMs    = $sw.ElapsedMilliseconds
        Gen0      = [GC]::CollectionCount(0)
        Gen1      = [GC]::CollectionCount(1)
        Gen2      = [GC]::CollectionCount(2)
    }
}

# 对比不同方式的内存消耗
$result1 = Measure-ScriptMemory -Label "数组累加" -ScriptBlock {
    $arr = @()
    foreach ($i in 1..10000) { $arr += $i }
}

$result2 = Measure-ScriptMemory -Label "List 泛型" -ScriptBlock {
    $list = [System.Collections.Generic.List[int]]::new()
    foreach ($i in 1..10000) { $list.Add($i) }
}

$result3 = Measure-ScriptMemory -Label "赋值变量" -ScriptBlock {
    $result = foreach ($i in 1..10000) { $i }
}

"数组累加", "List 泛型", "赋值变量" | ForEach-Object {
    switch ($_) {
        "数组累加" { $result1 }
        "List 泛型" { $result2 }
        "赋值变量" { $result3 }
    }
} | Format-Table -AutoSize

执行结果示例：

PowerShell 进程内存分析
  工作集 (Working Set):    156.78 MB
  专用字节 (Private Bytes): 142.34 MB
  虚拟内存:                1024.56 MB
  句柄数:                  523
  线程数:                  12

.NET 堆内存：34.56 MB

GC 代数回收次数：
  Gen 0: 15
  Gen 1: 3
  Gen 2: 1

Label    BeforeMB AfterMB DeltaMB TimeMs Gen0 Gen1 Gen2
-----    -------- ------- ------- ------ ---- ---- ----
数组累加     34.56   42.31    7.75    234   18    3    1
List 泛型    42.31   42.34    0.03     12   18    3    1
赋值变量     42.34   42.35    0.01      8   18    3    1

垃圾回收与内存释放

# 大对象堆（LOH）分析
# 超过 85,000 字节的对象存储在 LOH 中，LOH 的回收代价很高
function Get-LargeObjectStats {
    # 使用 GC 内存信息
    $totalMemory = [GC]::GetTotalMemory($false)
    $heapSize = [System.AppDomain]::CurrentDomain.MonitoringTotalAllocatedMemorySize

    Write-Host "总分配内存：$([math]::Round($heapSize / 1MB, 2)) MB" -ForegroundColor Cyan
    Write-Host "当前存活内存：$([math]::Round($totalMemory / 1MB, 2)) MB" -ForegroundColor Yellow

    # 强制 GC 回收
    Write-Host "`n执行完整 GC 回收..." -ForegroundColor Yellow
    [GC]::Collect()
    [GC]::WaitForPendingFinalizers()
    [GC]::Collect()  # 二次回收确保 Finalizer 队列的对象被回收

    $afterGC = [GC]::GetTotalMemory($true)
    $freed = $totalMemory - $afterGC
    Write-Host "回收后内存：$([math]::Round($afterGC / 1MB, 2)) MB（释放 $([math]::Round($freed / 1MB, 2)) MB）" -ForegroundColor Green
}

Get-LargeObjectStats

# 处理大文件时的内存优化
function Get-LargeFileHashBatch {
    param(
        [string]$Path,
        [int]$BatchSize = 100
    )

    $files = [System.IO.Directory]::EnumerateFiles($Path, "*", [System.IO.SearchOption]::AllDirectories)
    $batch = @()
    $totalProcessed = 0

    foreach ($file in $files) {
        $info = [System.IO.FileInfo]::new($file)
        $hash = (Get-FileHash $file -Algorithm SHA256).Hash

        $batch += [PSCustomObject]@{
            File   = $info.Name
            SizeKB = [math]::Round($info.Length / 1KB, 2)
            Hash   = $hash.Substring(0, 16) + "..."
        }

        $totalProcessed++

        if ($batch.Count -ge $BatchSize) {
            # 输出批次结果并释放引用
            $batch
            $batch = @()

            if ($totalProcessed % 500 -eq 0) {
                [GC]::Collect()
                $mem = [math]::Round([GC]::GetTotalMemory($false) / 1MB, 2)
                Write-Host "  已处理 $totalProcessed 个文件，内存：$mem MB" -ForegroundColor DarkGray
            }
        }
    }

    # 输出最后一批
    if ($batch) { $batch }
    Write-Host "`n总计处理：$totalProcessed 个文件" -ForegroundColor Green
}

# 使用流式处理替代一次性加载
function Read-LargeCsvStreaming {
    param(
        [string]$Path,
        [int]$TopN = 10
    )

    $reader = [System.IO.StreamReader]::new($Path)
    $header = $reader.ReadLine()
    $columns = $header -split ','

    $count = 0
    while ($null -ne ($line = $reader.ReadLine()) -and $count -lt $TopN) {
        $values = $line -split ','
        $obj = [ordered]@{}
        for ($i = 0; $i -lt $columns.Count; $i++) {
            $obj[$columns[$i].Trim('"')] = $values[$i].Trim('"')
        }
        [PSCustomObject]$obj
        $count++
    }

    $reader.Close()
    $reader.Dispose()
}

Write-Host "`n流式处理避免了将整个文件加载到内存" -ForegroundColor Green

执行结果示例：

总分配内存：256.78 MB
当前存活内存：42.31 MB

执行完整 GC 回收...
回收后内存：18.45 MB（释放 23.86 MB）
  已处理 500 个文件，内存：24.56 MB
  已处理 1000 个文件，内存：22.34 MB
总计处理：1234 个文件
流式处理避免了将整个文件加载到内存

性能分析实战

# 脚本性能分析器
function Measure-ScriptPerformance {
    param(
        [Parameter(Mandatory)]
        [scriptblock]$ScriptBlock,

        [int]$Iterations = 3
    )

    $results = @()

    # 预热（排除 JIT 编译影响）
    Write-Host "预热中..." -ForegroundColor DarkGray
    & $ScriptBlock | Out-Null

    for ($i = 1; $i -le $Iterations; $i++) {
        [GC]::Collect()
        [GC]::WaitForPendingFinalizers()

        $memBefore = [GC]::GetTotalMemory($true)
        $sw = [System.Diagnostics.Stopwatch]::StartNew()

        & $ScriptBlock | Out-Null

        $sw.Stop()
        $memAfter = [GC]::GetTotalMemory($false)

        $results += [PSCustomObject]@{
            Iteration = $i
            TimeMs    = $sw.ElapsedMilliseconds
            MemoryKB  = [math]::Round(($memAfter - $memBefore) / 1KB, 2)
            Gen0      = [GC]::CollectionCount(0)
        }

        Write-Host "  第 $i 次：$($sw.ElapsedMilliseconds) ms" -ForegroundColor DarkGray
    }

    $avg = ($results | Measure-Object TimeMs -Average).Average
    $min = ($results | Measure-Object TimeMs -Minimum).Minimum
    $max = ($results | Measure-Object TimeMs -Maximum).Maximum

    Write-Host "`n性能统计：" -ForegroundColor Cyan
    Write-Host "  平均：$([math]::Round($avg, 2)) ms"
    Write-Host "  最快：$min ms"
    Write-Host "  最慢：$max ms"

    return $results
}

# 对比字符串拼接方式
Write-Host "=== 字符串拼接对比 ===" -ForegroundColor Yellow

Measure-ScriptPerformance -Iterations 3 -ScriptBlock {
    $s = ""
    foreach ($i in 1..1000) { $s += "Line $i`n" }
} | Out-Null

Measure-ScriptPerformance -Iterations 3 -ScriptBlock {
    $sb = [System.Text.StringBuilder]::new()
    foreach ($i in 1..1000) { $sb.AppendLine("Line $i") | Out-Null }
    $sb.ToString()
} | Out-Null

执行结果示例：

预热中...
  第 1 次：45 ms
  第 2 次：42 ms
  第 3 次：40 ms

性能统计：
  平均：42.33 ms
  最快：40 ms
  最慢：45 ms

注意事项

数组 += 陷阱：PowerShell 中 $arr += $item 每次都创建新数组，复杂度 O(n^2)，大数据集必须用 List 泛型

GC 非万能：显式调用 [GC]::Collect() 有其代价，不应过度使用，主要依赖 GC 的自动回收

大对象处理：超过 85KB 的对象进入 LOH，LOH 的碎片化是内存泄漏的常见原因

流式处理：处理大文件时使用 StreamReader/EnumerateFiles 代替 Get-Content/Get-ChildItem，避免一次性加载

对象释放：使用 IDisposable 对象（如 Stream、Connection）后务必调用 Dispose() 或使用 using 语句

32 位限制：Windows PowerShell 5.1（32 位）进程有 2GB 内存上限，处理大数据时应使用 64 位 PowerShell

2025-05-27发表2026-04-30更新powershell / tip11 分钟读完 (大约1706个字)

PowerShell 技能连载 - 性能优化与内存管理

适用于 PowerShell 5.1 及以上版本

PowerShell 的便利性往往以性能为代价——管道对象传递、灵活的类型转换、丰富的 .NET 集成，这些特性在处理小规模数据时非常方便，但面对大量数据（数万行 CSV、上千个文件、数百台服务器）时，性能瓶颈会非常明显。理解 PowerShell 的性能特征并掌握优化技巧，可以将脚本执行时间从数小时缩短到数秒。

本文将讲解常见的性能陷阱、优化技巧、内存管理策略，以及如何度量和对比脚本性能。

性能度量

优化之前先度量。PowerShell 提供了多种性能测量工具：

# 使用 Measure-Command 测量代码执行时间
Measure-Command {
    Get-ChildItem C:\ -Recurse -File | Where-Object { $_.Extension -eq '.log' }
} | Select-Object TotalSeconds, TotalMilliseconds

# 使用 Stopwatch 精确计时
$sw = [System.Diagnostics.Stopwatch]::StartNew()

# 你的代码
1..10000 | ForEach-Object { $_ * 2 }

$sw.Stop()
Write-Host "耗时：$($sw.Elapsed.TotalMilliseconds) 毫秒"

# 批量对比不同方案的性能
$iterations = 10000

$results = @(
    @{
        Name = 'ForEach-Object（管道）'
        Time = (Measure-Command {
            1..$iterations | ForEach-Object { $_ * 2 }
        }).TotalMilliseconds
    }
    @{
        Name = 'foreach 语句'
        Time = (Measure-Command {
            foreach ($i in 1..$iterations) { $i * 2 }
        }).TotalMilliseconds
    }
    @{
        Name = 'LINQ'
        Time = (Measure-Command {
            [System.Linq.Enumerable]::Range(1, $iterations) |
                ForEach-Object { $_ * 2 }
        }).TotalMilliseconds
    }
)

$results | ForEach-Object {
    [PSCustomObject]@{
        方法    = $_.Name
        耗时ms  = [math]::Round($_.Time, 2)
    }
} | Sort-Object 耗时ms | Format-Table -AutoSize

执行结果示例：

TotalSeconds TotalMilliseconds
------------ -----------------
        2.34          2345.67

耗时：15.23 毫秒

方法                    耗时ms
----                    ------
foreach 语句             12.34
LINQ                    45.67
ForEach-Object（管道）  234.56

注意：foreach 语句通常比 ForEach-Object 快 10-20 倍，因为后者需要经过完整的管道处理。在性能敏感的场景中优先使用 foreach 语句。

字符串拼接优化

字符串操作是 PowerShell 中最常见的性能陷阱之一：

# 陷阱：使用 += 拼接字符串（每次都创建新字符串）
Measure-Command {
    $result = ""
    1..10000 | ForEach-Object { $result += "Line $_`n" }
} | Select-Object TotalMilliseconds

# 优化一：使用 StringBuilder
Measure-Command {
    $sb = [System.Text.StringBuilder]::new()
    1..10000 | ForEach-Object { [void]$sb.AppendLine("Line $_") }
    $result = $sb.ToString()
} | Select-Object TotalMilliseconds

# 优化二：使用数组和 -join
Measure-Command {
    $lines = 1..10000 | ForEach-Object { "Line $_" }
    $result = $lines -join "`n"
} | Select-Object TotalMilliseconds

# 优化三：使用赋值表达式和 -join（最快）
Measure-Command {
    $result = 1..10000 | ForEach-Object { "Line $_" } | Join-String -Separator "`n"
} | Select-Object TotalMilliseconds

执行结果示例：

TotalMilliseconds
-----------------
         2345.67   # +=
          45.23    # StringBuilder
          38.45    # 数组 + -join
          32.12    # Join-String

集合操作优化

处理大量数据时，集合的选择至关重要：

# 陷阱：数组 += 操作（每次复制整个数组）
Measure-Command {
    $array = @()
    1..5000 | ForEach-Object { $array += "Item-$_" }
} | Select-Object TotalMilliseconds

# 优化：使用 List
Measure-Command {
    $list = [System.Collections.Generic.List[string]]::new()
    1..5000 | ForEach-Object { $list.Add("Item-$_") }
    $result = $list.ToArray()
} | Select-Object TotalMilliseconds

# 哈希表查找 vs 数组过滤
$data = 1..10000 | ForEach-Object { @{ Id = $_; Name = "Item-$_" } }

# 数组查找（线性扫描，O(n)）
Measure-Command {
    $data | Where-Object { $_.Id -eq 5000 }
} | Select-Object TotalMilliseconds

# 哈希表查找（O(1)）
$lookup = @{}
$data | ForEach-Object { $lookup[$_.Id] = $_ }

Measure-Command {
    $lookup[5000]
} | Select-Object TotalMilliseconds

执行结果示例：

TotalMilliseconds
-----------------
         1234.56   # 数组 +=
           12.34   # List<T>

# Where-Object 过滤
TotalMilliseconds: 45.67

# 哈希表查找
TotalMilliseconds: 0.12

文件处理优化

处理大量文件时，I/O 操作往往是最大的性能瓶颈：

# 陷阱：逐行读取大文件
Measure-Command {
    $lines = @()
    Get-Content "C:\Logs\large-app.log" | ForEach-Object {
        if ($_ -match 'ERROR') { $lines += $_ }
    }
} | Select-Object TotalMilliseconds

# 优化一：使用 Select-String
Measure-Command {
    $lines = Select-String -Path "C:\Logs\large-app.log" -Pattern 'ERROR'
} | Select-Object TotalMilliseconds

# 优化二：分批读取（减少管道开销）
Measure-Command {
    $lines = Get-Content "C:\Logs\large-app.log" -ReadCount 5000 |
        ForEach-Object { $_ | Where-Object { $_ -match 'ERROR' } }
} | Select-Object TotalMilliseconds

# 优化三：使用 StreamReader（处理超大文件）
Measure-Command {
    $reader = [System.IO.StreamReader]::new("C:\Logs\large-app.log")
    $errors = while (-not $reader.EndOfStream) {
        $line = $reader.ReadLine()
        if ($line -match 'ERROR') { $line }
    }
    $reader.Close()
} | Select-Object TotalMilliseconds

# CSV 处理优化
# 陷阱：Import-Csv 后再过滤
Measure-Command {
    Import-Csv "C:\Data\large.csv" | Where-Object { $_.Status -eq 'Active' }
} | Select-Object TotalMilliseconds

# 优化：使用 StreamReader + 直接解析
Measure-Command {
    $reader = [System.IO.StreamReader]::new("C:\Data\large.csv")
    $header = $reader.ReadLine() -split ','
    $active = while (-not $reader.EndOfStream) {
        $values = $reader.ReadLine() -split ','
        if ($values[3] -eq 'Active') {
            $obj = [ordered]@{}
            for ($i = 0; $i -lt $header.Count; $i++) {
                $obj[$header[$i]] = $values[$i]
            }
            [PSCustomObject]$obj
        }
    }
    $reader.Close()
} | Select-Object TotalMilliseconds

执行结果示例：

TotalMilliseconds
-----------------
         5678.90   # 逐行 += 拼接
          123.45   # Select-String
           89.23   # ReadCount 分批
           34.56   # StreamReader

内存管理

处理大量数据时，内存管理同样重要：

# 监控当前 PowerShell 进程的内存使用
$proc = Get-Process -Id $PID
Write-Host "工作集：$([math]::Round($proc.WorkingSet64/1MB, 2)) MB"
Write-Host "私有内存：$([math]::Round($proc.PrivateMemorySize64/1MB, 2)) MB"

# GC 基础操作
# 查看当前 GC 内存
[System.GC]::GetTotalMemory($false) / 1MB

# 强制垃圾回收（释放未引用的对象）
[System.GC]::Collect()
[System.GC]::WaitForPendingFinalizers()
[System.GC]::Collect()

Write-Host "GC 后内存：$([math]::Round([System.GC]::GetTotalMemory($true)/1MB, 2)) MB"

# 大对象处理模式
# 对于已知大小的集合，预分配容量
$list = [System.Collections.Generic.List[PSObject]]::new(10000)

# 使用 using 语句确保资源释放（PowerShell 7+）
Measure-Command {
    using ($reader = [System.IO.StreamReader]::new("C:\Logs\large-app.log")) {
        while (-not $reader.EndOfStream) {
            $line = $reader.ReadLine()
        }
    }
} | Select-Object TotalMilliseconds

# 处理大文件时分块处理，避免全部加载到内存
function Process-LargeFile {
    param([string]$Path, [int]$ChunkSize = 10000)

    $reader = [System.IO.StreamReader]::new($Path)
    $chunk = [System.Collections.Generic.List[string]]::new($ChunkSize)
    $lineNum = 0

    while (-not $reader.EndOfStream) {
        $chunk.Add($reader.ReadLine())
        $lineNum++

        if ($chunk.Count -ge $ChunkSize) {
            # 处理当前块
            Process-Chunk -Data $chunk -LineStart ($lineNum - $ChunkSize)

            # 清空块，释放内存
            $chunk.Clear()
            [System.GC]::Collect()
        }
    }

    # 处理最后不满一块的数据
    if ($chunk.Count -gt 0) {
        Process-Chunk -Data $chunk -LineStart ($lineNum - $chunk.Count)
    }

    $reader.Close()
}

执行结果示例：

工作集：245.67 MB
私有内存：312.34 MB

GC 前内存：156.78 MB
GC 后内存：89.23 MB

管道优化

理解管道的执行方式对优化至关重要：

# 陷阱：多次遍历集合
Measure-Command {
    $data = Get-ChildItem C:\Projects -Recurse -File
    $largeFiles = $data | Where-Object { $_.Length -gt 1MB }
    $recentFiles = $data | Where-Object { $_.LastWriteTime -gt (Get-Date).AddDays(-7) }
    $ps1Files = $data | Where-Object { $_.Extension -eq '.ps1' }
} | Select-Object TotalMilliseconds

# 优化：单次遍历，分类存储
Measure-Command {
    $largeFiles = [System.Collections.Generic.List[IO.FileInfo]]::new()
    $recentFiles = [System.Collections.Generic.List[IO.FileInfo]]::new()
    $ps1Files = [System.Collections.Generic.List[IO.FileInfo]]::new()

    foreach ($file in (Get-ChildItem C:\Projects -Recurse -File)) {
        if ($file.Length -gt 1MB) { $largeFiles.Add($file) }
        if ($file.LastWriteTime -gt (Get-Date).AddDays(-7)) { $recentFiles.Add($file) }
        if ($file.Extension -eq '.ps1') { $ps1Files.Add($file) }
    }
} | Select-Object TotalMilliseconds

# 过滤优化：尽早过滤，减少后续处理量
# 差：获取所有文件后再过滤
Get-ChildItem C:\ -Recurse -File | Where-Object { $_.Extension -eq '.log' }

# 好：在命令参数中过滤
Get-ChildItem C:\ -Recurse -Filter *.log

执行结果示例：

TotalMilliseconds
-----------------
          345.67   # 多次遍历
          123.45   # 单次遍历

注意事项

先度量再优化：不要凭直觉优化，使用 Measure-Command 确认瓶颈所在
foreach 优于 ForEach-Object：在不需要管道流式处理时，使用 foreach 语句代替 ForEach-Object
**避免数组 +=**：用 [List<T>] 或 [ArrayList] 替代，或直接赋值为数组
哈希表用于查找：需要频繁查找时，将数据构建为哈希表，避免线性扫描
流式处理：处理大量数据时，尽量逐条处理而不是全部加载到内存
合理使用 GC：不要频繁调用 [GC]::Collect()，它会暂停所有线程。仅在处理完大对象后手动触发

内存诊断与监控

垃圾回收与内存释放

性能分析实战

注意事项

性能度量

字符串拼接优化

集合操作优化

文件处理优化

内存管理

管道优化

注意事项

链接

分类

最新文章

归档

标签