Python 文件 truncate() 方法(截断返回截取长度)

概述 Python 文件 truncate() 方法用于截断文件并返回截断的字节长度。 指定长度的话,就从文件的开头开始截断指定长度,其余内容删除;不指定长度的话,就从文件开头开始截断到当前...

发布于 2018-09-20 阅读(1079)

python中socket error 10054的解决方法

一个连接被对方重设。一个建立的连接被远程主机强行关闭,若远程主机上的进程异常终止运行(由于内存冲突或硬件故障),或者针对套接字执行了一次强行关闭,便会产生10054错误...

发布于 2018-06-08 阅读(1987)

Python注册登录时验证码识别处理方法实例

Python验证码识别处理方法实例 对于爬虫来说,一个比较大的阻碍就是验证码,验证码也是反爬虫的有效措施之一。接下来针对验证码出现的方式,就如何突破验证码进行进一步的探讨。...

发布于 2018-01-31 阅读(759)

Python爬虫之Web端协议网页登录POST分析(知乎/百度云)实例

Python爬虫之Web端协议网页登录POST分析 本节探讨的是那些需要登录之后才能进行页面爬取的情况,属于深层次的网页爬取。我们将讲一些大家熟悉的例子,比如爬取论坛或者贴吧的内容...

发布于 2018-01-30 阅读(782)

python爬虫入门教程之 Selenium库的使用

python爬虫入门教程之 Selenium库的使用 上一节我们讲解了 PhantomJS的用法 ,它只是一个没有界面的浏览器,运行的还是JavaScript脚本,这和Python爬虫开发有什么联系呢?本节介绍的Selenium能...

发布于 2018-01-29 阅读(248)

Python爬虫制作之PhantomJS的入门用法

Python爬虫制作之PhantomJS的入门用法 直接从浏览器中提取渲染好的HTML文档。如果 Ajax请求很多,有时请求参数还进行了加密,我们手动分析每一个 Ajax请求,将成为一项繁重的工作,而且...

发布于 2018-01-28 阅读(357)

MongoDB的安装和Python操作MongoDB(创建/查询/插入/修改/删除)的方法

更适合Python爬虫的MongoDB MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。和 MySQL不同的,MongoDB是一个介于关系数据库和...

发布于 2018-01-27 阅读(385)

Python操作MySQL(创建/连接/查询/插入/修改/删除)的方法

Python操作MySQL 1.导入MySQLdb数据库模块 在导入MySQLdb之前,需要安装MySQLdb模块。使用pip安装,命令如下: pip install MySQL-python 安装成功后,导入MySQLdb模块: import MySQLdb 2.打开数据库 sqlit...

发布于 2018-01-27 阅读(623)

Python操作SQLite(创建/连接/查询/插入/修改/删除)的方法

Python操作SQLite 1.导入sqlite数据库模块 Python中使用sqlite3模块操作SQLite。从Python 2.5以后,sqlite3 成为内置模块,不需要额外安装,只需要导入即可。 import sqlite3 图8-6 事务提交 2.创建/打开...

发布于 2018-01-24 阅读(764)

(Python)基础爬虫架构及运行流程

基础爬虫架构及运行流程 首先讲解一下基础爬虫的架构,如图6-2所示。介绍基础爬虫包含哪些模块,各个模块之间的关系是什么。 图6-2 基础爬虫框架 基础爬虫框架主要包括五大模块,...

发布于 2018-01-22 阅读(598)