为了一些电视台追求数据的实时更新,经常会用的方式,如股票交换数据,交易数据和其他货币的WebSocket。关于WebSocket的机制,也没有对相关信息不足。但在WebSocket的爬行动物的文章,还是比较小的。所以要专门编写这篇文章分享,我希望能帮助别人。

文本

1,首先要认识到,WebSocket的和正常的HTTP请求是有所区别的。WebSocket的方式:用户的浏览器(客户端)和其他站(服务器)是第一次握手,建立连接握手是成功的,可以理解为双方建立了专用通道的。WebSocket的是全双工,客户端可以发消息给服务器,服务器可以给客户机的消息。一般交易站,客户端与服务器建立连接后,发送多封邮件,告诉服务器,数据订阅。服务器之后将继续建立新的数据推送。推送数据可在服务客户端的端让路发送pinG请求,客户机返回给它一个乒乓消息来检测连接是否正常(心跳)(一些站将被客户端平被发送)。
所以WebSocket的爬行动物的步骤:。

2。对于python2。爬行动物7,WebSocket的模块,安装程序:。

3,例如,选择了国内访问比特币交易平台: 。

4,一些站越过不是字符串,而是二进制数据。?。g。[火灾币](像。 ![Websocket02]( 我当时年少无知,甚至与结构,binascii模块把字符串,但是,都失败了。在各种搜索也无果。 后来的浏览器调试,导航到地方的js代码解析。JS看了看代码,认为这应该是第一个二进制数据的数字,这组已经做了一些数字解密,那么阵列解密的字符,也就是最后的明文字符串。困难准备使用可擦写Python或拔出由JS的NodeJS运行的代码块,发现有点大。 忧伤的场合偶然发现了这个WebSocket的传过来的数据,其实只是二进制数据压缩,这是坑爹太后!劳动忙了大半天,几乎JS代码将被用来解压缩重写!这是愚蠢,真的够道行。

把代码,


文/信息/ 83031281

本文链接:Python websocket爬虫

您可能也会喜欢

友情链接:

大悲咒注音 心经唱诵 经文