142

Python爬虫开发中正则表达式基本语法与使用方法

4.2 正则表达式 在编写处理网页文本的程序时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。正则表达式是由普通字符(例如字符a到z)以...

发布于 2018-01-20 阅读(142)
143

Python爬虫开发HTML解析:Firebug工具的使用

HTML解析 HTML网页数据解析提取是Python爬虫开发中非常关键的一步。 4.1 初识Firebug Firebug是一个用于Web前端开发的工具,它是FireFox浏览器的一个扩展插件。它可以用于调试JavaScript、查看...

发布于 2018-01-20 阅读(143)
156

网站的安全架构之网站攻击与防御

网站攻击与防御 攻击新浪微博的手段被称作XSS攻击,它和SQL注入攻击构成网站应用攻击最主要的两种手段,全球大约70%的Web应用攻击都来自 XSS攻击和SQL注入攻击。此外,常用的Web应用...

发布于 2018-01-20 阅读(156)
156

电子邮件服务器的安装与配置和搭建 U-mail 邮件服务器的方法

电子邮件服务器的安装与配置 电子邮件是当前最重要的通信方式,是Internet应用最广泛的服务之一。通过网络的电子邮件系统,用户可以用非常低廉的价格,以非常快速的方式,与世界...

发布于 2018-01-20 阅读(156)
139

DNS转发器和DNS服务器备份与恢复详解

DNS服务器测试与备份与恢复 本章要点 □ 测试 DNS 服务器 □ 备份与恢复 DNS 服务器 10.4 测试DNS服务器 本节视频教学录像:5分钟已经安装与配置好的DNS服务器需要经过一系列的测试,以...

发布于 2018-01-20 阅读(139)
154

DNS服务器的的工作原理安装与配置

DNS服务器的安装与配置 DNS 是域名系统(Domain Name System)的英文缩写,是互联网最重要的服务之一。它拥有一个可以将域名和IP地址相互映射的分布式数据库,能够使人更方便地使用域名...

发布于 2018-01-20 阅读(154)
171

PHP实现合并两个排序链表的代码

这篇文章主要介绍了PHP实现合并两个排序链表的方法,涉及php针对链表的遍历、判断、排序等相关操作技巧,需要的朋友可以参考下...

发布于 2018-01-19 阅读(171)
158

网络爬虫原理(代理/超时/重定向/Proxy/headers设置/httplib/urllib实现)

初识网络爬虫 从本章开始,将正式涉及Python爬虫的开发。本章主要分为两个部分:一部分是网络爬虫的概述,帮助大家详细了解网络爬虫;另一部分是HTTP请求的Python实现,帮助大家了...

发布于 2018-01-19 阅读(158)
99

Web前端基础(W3C标准/html/CSS/JavaScript/XPath/JSON)

Web前端基础 爬虫主要是和网页打交道,了解Web前端的知识是非常重要的。 Web前端的知识范围非常广泛,不可能面面俱到和深入讲解,本章主要是抽取Web前端中和爬虫相关的知识点进行...

发布于 2018-01-19 阅读(99)
199

网站的伸缩性架构设计(负载均衡/分布式缓存/数据存储服务器集群)

网站的伸缩性架构 所谓网站的伸缩性是指不需要改变网站的软硬件设计,仅仅通过改变部署的服务器数量就可以扩大或者缩小网站的服务处理能力。 京东网(www.360buy.com)在2011年年末...

发布于 2018-01-19 阅读(199)