以下是一个使用C#实现的简单爬虫程序:
using System;
using System.Net;
class Program
{
static void Main(string[] args)
{
string url = "https://www.example.com"; // 要爬取的网页地址
WebClient client = new WebClient();
string html = client.DownloadString(url); // 下载网页内容
// 在这里对html进行解析和处理,提取需要的信息
Console.WriteLine(html); // 输出网页内容
}
}
上述程序使用WebClient
类来下载指定网页的内容,并将内容存储在字符串变量html
中。你可以在其后添加解析和处理HTML内容的代码,提取出你感兴趣的信息。最后,使用Console.WriteLine
方法将网页内容输出到控制台。
请注意,爬取网页的行为可能会受到网站的限制,使用爬虫程序时请遵守相关法律法规和网站的使用条款。
辰迅云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读: c# substring怎么用