PowerShell 技能连载 - 读取网站内容
通常情况下,通过 PowerShell 的 Invoke-WebRequest
命令来获取原始的 HTML 网站内容是很常见的情况。脚本可以处理 HTML 内容并对它做任意操作,例如用正则表达式从中提取信息:
1 | $url = "www.tagesschau.de" |
然而,有些时候一个网站的内容是通过客户端脚本代码动态创建的。那么,Invoke-WebRequest` 并不能返回浏览器中所见的完整 HTML 内容。如果仍要获取 HTML 信息,您需要借助一个真实的 WEB 浏览器。一个简单的方法是使用内置的 Internet Explorer:
1 | $ie = New-Object -ComObject InternetExplorer.Application |
PowerShell 技能连载 - 读取网站内容
http://blog.vichamp.com/2018/10/30/accessing-website-content/