FMZ平台Python爬虫应用初探--爬取币安公告内容

发明者量化-小小梦

关注私信

关注

1281

关注者

FMZ平台Python爬虫应用初探--爬取币安公告内容

创建于: 2021-11-12 17:08:26, 更新于: 2024-12-04 21:18:45

3863

FMZ平台Python爬虫应用初探–爬取币安公告内容

最近看了一下社区、文库里还没有关于Python爬虫的相关资料，基于作为一个QUANT全面发展的精神。非常非常浅显的学习了一下爬虫相关的概念和知识。了解一番之后发现「爬虫技术」这个“坑”还挺大，本篇只是作为初探「爬虫技术」。在FMZ量化交易平台上关于爬虫技术做一个最最简单的实践。

需求

对于喜欢打新的交易者，总是希望在第一时间获取交易所上币信息。人工一直盯着交易所网站显然不现实。那么就需求使用爬虫脚本监控交易所公告页面，检测新的公告以便在第一时间得到通知、提醒。

初探

用一个非常简单的程序来作为入门（真正的强大的爬虫脚本远远复杂的多，先慢慢来）。程序逻辑十分简单，就是让程序不停的访问交易所的公告页面，解析获取的HTML内容，检测特定的标签内容是否更新。

实施代码

可以用一些好用的爬虫框架。不过考虑到需求很简单，直接编写也可以。

需要用到python的库：

```bs4```，可以简单理解为用来解析网页HTML代码的库。

代码：

from bs4 import BeautifulSoup import requests

urlBinanceAnnouncement = “https://www.binancezh.io/en/support/announcement/c-48?navId=48” # 币安公告页面地址

def openUrl(url): headers = {‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36’} r = requests.get(url, headers=headers) # 使用requests库访问url，即币安的公告网页地址 if r.status_code == 200: r.encoding = ‘utf-8’ # Log(“success! {}”.format(url)) return r.text # 访问成功的话返回网页内容文本 else: Log(“failed {}”.format(url))

def main(): preNews_href = “” lastNews = “” Log(“watching…”, urlBinanceAnnouncement, “#FF0000”) while True: ret = openUrl(urlBinanceAnnouncement) if ret: soup = BeautifulSoup(ret, ‘html.parser’) # 把网页文本解析为对象 lastNewshref = soup.find(‘a’, class=‘css-1ej4hfo’)[“href”] # 查找特定的标签，获取href lastNews = soup.find(‘a’, class_=‘css-1ej4hfo’).get_text() # 获取这个标签中的内容 if preNews_href == “”: preNews_href = lastNews_href if preNews_href != lastNews_href: # 检测到标签发生变动，即有新的公告产生 Log(“New Cryptocurrency Listing update!”) # 打印提示信息 preNews_href = lastNews_href LogStatus(_D(), “\n”, “preNews_href:”, preNews_href, “\n”, “news:”, lastNews) Sleep(1000 * 10)

”`

运行

FMZ平台Python爬虫应用初探–爬取币安公告内容

甚至可以再加以扩展，例如检测到有新公告出现。分析公告中上新的币种，自动下单打新交易。

相关推荐

全部留言

eth8888

Traceback (most recent call last): File "<string>", line 999, in __init_ctx__ File "<string>", line 1, in <module> ModuleNotFoundError: No module named 'bs4' 复制代码到实盘提示错误，是不是缺失python的库。怎么添加库到托管着呢。

2022-01-12 19:11:47

发明者量化-小小梦

交易所的问题，可以重试看看。

2022-01-14 10:54:14

eth8888

GetAccount: 503: {"code":"50001","data":[],"msg":"Service temporarily unavailable, please try again later. "} 我换了自己租的服务器了。原来的实盘换成这个服务器就报这个错，是因为服务器通信有问题吗？

2022-01-13 17:18:02

发明者量化-小小梦

一键部署的托管者，服务器是有限权限，无法安装。用自己租的服务器可以，登录上服务器安装即可。

2022-01-13 10:35:34

eth8888

我搜了会在自己电脑安装，我想问怎么在租的托管者上安装呢

2022-01-12 21:09:10

发明者量化-小小梦

可以百度下python安装库/包。有很多教程。

2022-01-12 20:35:03

eth8888

但是怎么安装呢。。。不会安装。

2022-01-12 20:18:57

发明者量化-小小梦

托管者所在系统的python 安装用到的所有包就可以了。

2022-01-12 19:33:33

ShawnQiang

作者你好，我也写了一个爬币安公告的爬虫，不管是用那个api接口还是主页的爬虫都有30s延迟，不知道你有没有解决这个问题，可以交流下吗，我的vx ShawnQiang1125

2021-12-27 02:31:39

dreamer1111

老哥，你的这个策略我有个问题就是，币安公告出消息了能不能第一时间爬取到，我经过测试发现只是有30多秒的延迟。

2021-12-05 20:03:54

发明者量化-小小梦

策略里做了轮询间隔，间隔10秒检测一次。访问某个页面太频繁了估计也不行。。

2021-12-06 09:42:02

slightly_drunk

我之前用 selenium + chrome 也抓过火币的公告，还附带公告截图

2021-11-14 00:01:30

发明者量化-小小梦

好的，感谢支持FMZ。

2021-11-15 11:36:49

slightly_drunk

我才玩fmz没多久，看了很多你的帖子，分享了很多干货出来，挺棒的，有机会多交流

2021-11-15 10:55:57

发明者量化-小小梦

老哥 666，可以多发帖子交流哇！

2021-11-14 12:12:28

Forums

PINE Language FAQ Summary MyLanguage Web3 About Us

Product

Robot Strategy Node Platforms Tickets

API

Syntax guide User guide Trading api Blockchain Indicator