HI,你会用函数实现网页数据抓取吗?
随着互联网的高速发展,网页数据愈发成为数据分析过程中最重要的数据来源之一。
也许正是基于这样的考量,从2013版开始,Excel新增了一个名为Web的函数类别,使用其下的函数,可以通过网页链接从Web服务器获取数据,比如股票信息、天气查询、有道翻译等等。
举个小栗子。
输入以下公式,可以将A2单元格的值进行英汉或汉英互译。
=FILTERXML(WEBSERVICE("http://fanyi.youdao.com/translate?&i="&A2&"&doctype=xml"),"//translation")
公式看起来很长,这主要是因为网址长度偏长的缘故,实际上该公式的结构非常简单。
它主要有3部分构成。
第1部分构建网址。
"http://fanyi.youdao.com/translate?&i="&A2&"&doctype=xml"
这个是有道在线翻译的网页地址,包含了关键的参数部分,i="&A2是需要翻译的词汇,doctype=xml是返回文件的类型,是xml。只所以返回xml是因为FILTERXML函数可以获取XML结构化内容中的信息。
第2部分读取网址。
WEBSERVICE通过指定的网页地址从Web服务器获取数据(需要计算机联网状态)。
本例中,B2公式
=WEBSERVICE("http://fanyi.youdao.com/translate?&i="&A2&"&doctype=xml&version")
获取数据如下
<?xml version="1.0"encoding="UTF-8"?>
<response type="ZH_CN2EN"errorCode="0" elapsedTime="1">
<input>
<![CDATA[幸福]]>
</input>
<translation>
<![CDATA[happiness]]>
</translation>
</response>
第3部分获取目标数据。
这里使用了FILTERXML函数,FILTERXML函数语法是:
FILTERXML(xml,xpath)
共有两个参数,xml参数是有效的xml格式文本,xpath参数是需要查询的目标数据在xml中的标准路径。
通过第2部分获取的xml文件内容,我们可以很直接的看到幸福的翻译结果happiness处于translation路径下(标注粉红色的部分),因此第2参数设为” //translation”。
好了,这就是星光今天和大家分享的内容,感兴趣的小伙伴可以尝试使用web函数从百度天气预报获取家乡城市的天气信息~
挥手说晚安~
如果内容对你有用,请花费几秒钟给个评论!
由于评论审核机制,可能您的评论暂时不可见,不影响查看回复可见的内容!
扫描二维码推送至手机访问。
版权声明:本文由云淡风轻Mr.Liu发布,如需转载请注明出处。