如何使用 Excel 提取网页数据?
excel 提取网页数据 4种方法?
1、先打开有数据的网页,把网址进行复制
这里打开网址的浏览器建议最好选择IE浏览器去打开。
2、然后打开一个Excel表格新建一个Excel工作表
在Excel数据选项卡下方,获取外部数据组选择来自网站的命令。
在新建web查询对话框中复制地址,然后转到。
找到网页中的数据表,然后选择导入即可。
然后会填充引用地址。我们选择默认A1单元格即可
确定后,你就会看到对应的数据效果了。
如何提取网页中的所有链接?
第一步,
打开Visual Studio 2019 ,如下图所示:
第二步,
点击文件,新建项目,选择C#项目、Linux的控制台项目,如下图示:
第三步,
鼠标右键点击解决方案、项目下的依懒项,如下图所示:
鼠标左键选择管理NuGet程序包,然后出现如下图界面:
点击浏览,输入AngleSharp 名称,如下图所示:
选择上图第一项,点击右侧的安装按钮,如下图所示:
鼠标点击上图中的确定按钮,出现以下界面:
表示已经将依懒项AngleSharp安装到了项目中,如下图所示:
。
第四步,
右键双击解决方案项目下的Program.cs,打开源代码文件Program.cs,编写以下代码,
using System;
using System.Linq;
using AngleSharp;
using AngleSharp.Html.Dom;
namespace ConsoleGetAllLink
{
class Program
{
/// <summary>
/// 读取网页的所有链接
/// </summary>
static async void ReadAllLink()
{
//创建一个场景
var context = BrowsingContext.New(Configuration.Default.WithDefaultLoader());
//以异步方式打开hao123网址首页
var document = await context.OpenAsync("https://www.hao123.com/");
//查询hao123网址首页中所有的链接
var allLinks = document.All.Where(m => m.LocalName == "a");
//循环输出链接的名称和网址
foreach(var link in allLinks)
{
IHtmlAnchorElement ilink = link as IHtmlAnchorElement;
Console.WriteLine($"{ilink.TextContent} ,{ilink.Href}");
}
}
static void Main(string[] args)
{
//读取网页的所有链接
ReadAllLink();
if(Console.ReadLine().ToLower() == "q")
{
}
}
}
}
第五步,
按F5键调试运行,如下图所示:
运行结果:
。