当前位置:网站首页 > 更多 > 玩电脑 > 正文

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

作者:精品下载站 日期:2024-12-14 20:38:33 浏览:17 分类:玩电脑

使用 PowerShell 和 Regex 进行出色的解析


有一天,我和我的朋友 Gladys Kravitz 谈论 Active Directory,她随口说了一句关于从可分辨名称中解析出组织单位名称的内容。一方面,这是一项非常简单的任务,需要从 Active Directory cmdlet 中获取正确的可分辨名称。您真正需要做的就是分割字符串。

$ou = "OU=Foo,OU=Top,DC=Company,DC=pri"
$ou.split(",")[0]

该代码按逗号分割并选择数组中的第一个元素。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

但我认为还有另一种选择。如果我只想要顶级 OU 的名称(即 Foo)怎么办?所以很自然地我转向了正则表达式。

不要贪婪

我首先创建一组测试专有名称值。

$DN = @("OU=Foo,OU=Top,DC=Company,DC=pri",
    "OU=Foo123,OU=FooBar,DC=Company,DC=pri",
    "ou=Foo,ou=Top,dc=Company,dc=pri",
    "OU=Gladys Kravitz Monitors,OU=Top,DC=Company,DC=pri",
    "OU=A723-Test,OU=Top,OU=Middle,DC=Company,DC=pri",
    "OU=JEA_Operators,DC=Company,DC=Pri",
    "CN=Users,DC=Company,DC=pri",
    "CN=ArtD,OU=IT,DC=Company,DC=Pri",
    "cn=johnd,ou=sales,dc=company,dc=pri",
    "CN=SamS,OU=This,OU=That,DC=Company,DC=Pri",
    "OU=Domain Controllers,DC=Company,DC=Pri")

如果你仔细观察,你会发现我使用了多种形式,因为我可能并不总是能够保证数据的样子。我还从从 OU 可分辨名称获取顶级 OU 名称的角度开始本练习。我已经包含了我知道应该失败的测试值。 使用正则表达式模式进行开发时,使用您知道应该失败的数据进行测试非常重要。

有了这些数据,我就开始使用正则表达式模式:

[regex]$rx = "^(ou|OU)=.*(?=,)"

该模式表示,“锚定在行 line (^) 的开头,并查找字符串“ou”或 (|)“OU”,后跟 =。然后是任何字符 (.*),如果向前看,您会看到逗号 (?=,)。”让我们尝试一下数组中的第一个元素。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

这基本上奏效了。问题在于该模式与每个可能的字符串都匹配。换句话说,正则表达式模式是贪婪的。大多数时候这不是问题。但是,在这里我希望正则表达式模式在第一个 OU 匹配之后停止。

[regex]$rx = "^(ou|OU)=.*?(?=,)"

主要区别是“?”插入在.“*”之后。这使得模式在第一次匹配后停止。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

现在我可以处理名称数组了。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

没有我想要的那么干净,因为我得到了不匹配字符串的空白。这可能会更好。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

现在我只有在匹配的情况下才能获取值。但我想更进一步。

命名捕获

我决定获取第一个 OU 的名称,例如 Foo 和 Foo123。为此,我将使用命名捕获。这是我修改后的正则表达式模式。

[regex]$rx = "^(ou|OU)=(?<OUName>.*?(?=,))"

主要区别在于,我现在为任何与括号中的模式最后部分匹配的内容定义一个名称 OUName。在非贪婪模式前面添加“?”,定义名称。匹配现在包括一个新组。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

这是一个获取名为 capture 的脚本技巧。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

这意味着我可以处理我的数组:

$dn | Where-Object { $rx.IsMatch($_) } | ForEach-Object { $rx.Match($_).groups["OUName"].Value }

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

我的下一步通常是基于此代码构建一个函数。但我还没有完成。

获取顶级 OU 名称

用户和组的专有名称怎么样?我希望能够解析出顶级组织单位的名称。我将用这个进行测试。

$art = "CN=ArtD,OU=IT,DC=Company,DC=Pri"

棘手的部分是字符串可能以 CN 或 OU 开头。这是我的正则表达式模式的另一个版本。

[regex]$rx = "^(((CN=.*?))?)(ou|OU)=(?<OUName>.*?(?=,))"

通过这种模式,我正在寻找可能以
“CN=something”开头的东西。

^(((CN=.*?))?)

该模式使用非贪婪匹配。整体模式是可选。也就是说,它可能存在。格式为“(?)”。让我们看看它是否有效。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

看起来不错。但如果字符串以“cn”开头,则会失败。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

这是在 PowerShell 中使用正则表达式时的一个潜在陷阱,也是我在 $DN 测试数据集中添加各种大小写的原因。避免大小写问题的更好方法是像这样定义正则表达式对象。

$rx = [System.Text.RegularExpressions.Regex]::new("^(((CN=.*?))?)OU=(?<OUName>.*?(?=,))","IgnoreCase")

现在字符串使用 OU、ou 或 oU 并不重要。他们都会匹配。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

现在使用我的测试数据处理用户和组名称。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

出色的。我将基于此代码构建一个函数,该函数将处理可分辨名称并提供第一个或顶级组织单位名称。

Function Get-TopOUName {
    [cmdletbinding()]
    Param(
        [Parameter(Position = 0, Mandatory, ValueFromPipeline, ValueFromPipelineByPropertyName)]
        [alias("dn")]
        [string]$DistinguishedName
    )

    Begin {
        Write-Verbose "[$((Get-Date).TimeofDay) BEGIN  ] Starting $($myinvocation.mycommand)"
        #ignore case
        $rx = [System.Text.RegularExpressions.Regex]::new("^(((CN=.*?))?)OU=(?<OUName>.*?(?=,))","IgnoreCase")
    } #begin

    Process {
        Write-Verbose "[$((Get-Date).TimeofDay) PROCESS] Processing $DistinguishedName"
        If ($rx.IsMatch($DistinguishedName) ) {
            $rx.Match($DistinguishedName).groups["OUName"].Value
        }
    } #process

    End {
        Write-Verbose "[$((Get-Date).TimeofDay) END    ] Ending $($myinvocation.mycommand)"
    } #end
}

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

如果仔细观察,您会发现 CN=Users,DC=Company,DC=pri 没有产生结果,这意味着我的模式正在运行。让我们用 Active Directory 来测试一下。

Get-ADUser -filter * | Select-Object Name,SamAccountName,
@{Name="OU";Expression={Get-TopOUName $_.distinguishedname}},distinguishedname

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

前几个帐户不在 OU 中,因此结果符合预期。但现在我有一个可以使用的工具。

[玩转系统] 使用 PowerShell 和 Regex 进行出色的解析

了解更多

您可能没有实际需要我的模式或代码与 Active Directory 一起使用。但我希望您能从我解决问题的方法中学到一些东西,并说明一些正则表达式概念。如果您想了解有关正则表达式的更多信息,我有一门关于该主题的完整 Pluralsight 课程。

如果简单的字符串分割有效,请务必采取简单的方法。但有时您可能需要更复杂的东西,我认为您会发现正则表达式是一个优雅的解决方案。

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯