肖朋伟

Stay hungry,stay foolish!

Python爬虫教程-28-Selenium 操纵 Chrome

Python爬虫教程-28-Selenium 操纵 Chrome 我觉得本篇是很有意思的,闲着没事来看看!PhantomJS 幽灵浏览器,无界面浏览器,不渲染页面。Selenium + PhantomJS 在之前是很完美的搭配。后来在 2017 年 Google 宣布 Chrome 也宣布支持不...

2018-08-31 21:16:07

阅读数 11808

评论数 0

Python爬虫教程-27-Selenium Chrome版本与chromedriver兼容版本对照表

我们使用Selenium+Chrome时,版本不一样, 会导致 chromedriver 停止运行 chromedriver 所有版本下载链接:http://npm.taobao.org/mirrors/chromedriver/2.39/ 请根据下面表格下载支持自己 Chrome 的版本 ...

2018-08-31 19:46:18

阅读数 11751

评论数 0

Python爬虫教程-26-Selenium + PhantomJS

Python爬虫教程-26-Selenium + PhantomJS 动态前端页面 : JavaScript: JavaScript一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型。它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言...

2018-08-31 11:52:35

阅读数 10668

评论数 0

Python爬虫教程-25-数据提取-BeautifulSoup4(三)

Python爬虫教程-25-数据提取-BeautifulSoup4(三) 本篇介绍 BeautifulSoup 中的 css 选择器 css 选择器 使用 soup.select 返回一个列表 通过标签名称:soup.select(“title”) 通过类名:soup.select(“.c...

2018-08-31 10:37:56

阅读数 10776

评论数 0

Python爬虫教程-24-数据提取-BeautifulSoup4(二)

Python爬虫教程-24-数据提取-BeautifulSoup4(下) 本篇介绍 bs 如何遍历一个文档对象 遍历文档对象 contents:tag 的子节点以列表的方式输出 children:子节点以迭代器形式返回 descendants:所有子孙节点 string:用string...

2018-08-30 20:57:46

阅读数 10866

评论数 0

Python爬虫教程-23-数据提取-BeautifulSoup4(一)

Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据,查看文档 https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/ Python爬虫教程-23-数据提取-BeautifulSoup4 Beau...

2018-08-30 10:45:52

阅读数 10960

评论数 0

Python爬虫教程-22-lxml-etree和xpath配合使用

Python爬虫教程-21-lxml-etree和xpath配合使用 lxml:python 的HTML/XML的解析器 官网文档:https://lxml.de/ 使用前,需要安装安 lxml 包 功能: 1.解析HTML:使用 etree.HTML(text) 将字符串格式的 html...

2018-08-29 20:26:25

阅读数 13644

评论数 0

Python爬虫教程-21-xpath简介

本篇简单介绍 xml 在python爬虫方面的使用,想要具体学习 xpath 可以到 w3school 查看 xpath 文档 xpath文档:http://www.w3school.com.cn/xpath/index.asp Python爬虫教程-21-xpath 什么是 XPat...

2018-08-29 18:59:02

阅读数 11097

评论数 0

Python爬虫教程-20-xml简介

本篇简单介绍 xml 在python爬虫方面的使用,想要具体学习 xml 可以到 w3school 查看 xml 文档 xml 文档链接:http://www.w3school.com.cn/xmldom/xmldom_reference.asp Python爬虫教程-19-数据提取-xml ...

2018-08-29 18:23:43

阅读数 10771

评论数 0

Python爬虫教程-19-数据提取-正则表达式(re)

本篇主页内容:match的基本使用,search的基本使用,findall,finditer的基本使用,匹配中文,贪婪与非贪婪模式 Python爬虫教程-19-数据提取-正则表达式(re) 正则表达式:一套规则,可以在字符串文本中进行搜查替换等 正则的常用方法: match:从开始位置开始...

2018-08-29 12:06:04

阅读数 14038

评论数 0

Python爬虫教程-18-页面解析和数据提取

本篇针对的数据是已经存在在页面上的数据,不包括动态生成的数据,今天是对HTML中提取对我们有用的数据,去除无用的数据 Python爬虫教程-18-页面解析和数据提取 结构化数据:先有的结构,再谈数据 json数据 1.处理此类数据,通常使用JSON Path 2.转换成python类型的...

2018-08-29 12:05:53

阅读数 10733

评论数 0

TensorFlow笔记-07-神经网络优化-学习率,滑动平均

TensorFlow 笔记-06-神经网络优化-交叉熵,学习率 交叉熵 交叉熵(Cross Entropy):表示两个概率分布之间的距离,交叉熵越大,两个概率分布距离越远,两个概率分布越相异;交叉熵越小,两个概率分布距离越近,两个概率分布越相似 交叉熵计算公式:H(y_, y) = -Σy_ ...

2018-08-28 21:48:07

阅读数 11455

评论数 0

Python爬虫教程-17-ajax爬取实例(豆瓣电影)

Python爬虫教程-17-ajax爬取实例(豆瓣电影) ajax: 简单的说,就是一段js代码,通过这段代码,可以让页面发送异步的请求,或者向服务器发送一个东西,即和服务器进行交互 对于ajax: 1.一定会有 url,请求方法(get, post),可能有数据 2.一般使用 json ...

2018-08-26 13:07:39

阅读数 10906

评论数 0

Python爬虫教程-16-破解js加密实例(有道在线翻译)

python爬虫教程-16-破解js加密 在爬虫爬取网站的时候,经常遇到一些反爬虫技术,比如: 加cookie,身份验证UserAgent 图形验证,还有很难破解的滑动验证 js签名验证,对传输数据进行加密处理 对于js加密 经过加密传输的就是密文,但是加密函数或者过程一定是在浏览器完成...

2018-08-26 12:40:41

阅读数 14877

评论数 7

TensorFlow笔记-06-神经网络优化-损失函数,自定义损失函数,交叉熵

TensorFlow笔记-06-神经网络优化-损失函数,自定义损失函数 神经元模型:用数学公式比表示为:f(Σi xi*wi + b), f为激活函数 神经网络 是以神经元为基本单位构成的 激活函数:引入非线性激活因素,提高模型的表达能力 常用的激活函数有relu、sigmoid、tanh等...

2018-08-24 14:57:39

阅读数 11793

评论数 0

怎么在markdown中使用上标、下标?

怎么在markdown中使用上标、下标 markdown中如何加入上标、下标? 如指数,下标,商标等等。 解决方法 Markdown一个套兼容HTML的语法,所以使用HTML中下标下标的语法即可。 写法 H<sub...

2018-08-24 10:51:08

阅读数 13754

评论数 1

TensorFlow笔记-05-反向传播,搭建神经网络的八股

TensorFlow笔记-05-神经网络的实现过程(代码),反向传播 先回顾神经网络的实现过程 神经网络的实现过程 1.准备数据,提取特征,作为输入喂给神经网络 2.搭建NN结构,从输入到输出(先搭建计算图,再用会话执行) (NN前向传播算法===&am...

2018-08-23 21:38:18

阅读数 10102

评论数 0

TensorFlow笔记-04-神经网络的实现过程,前向传播

TensorFlow笔记-03-神经网络的实现过程 基于TensorFlow的NN:用张量表示数据,用计算图搭建神经网络,用会话执行计算图,优化线上的权重(参数),得到模型 张量(tensor):多维数组(列表) 阶:张量的维数 计算图(Graph):搭建神经网络的计算过程,只搭建,不运算 ...

2018-08-20 20:08:54

阅读数 10672

评论数 0

TensorFlow笔记-03-张量,计算图,会话

TensorFlow笔记-02-张量,计算图,会话 搭建你的第一个神经网络,总结搭建八股 基于TensorFlow的NN:用张量表示数据,用计算图搭建神经网络,用会话执行计算图,优化线上的权重(参数),得到模型 张量(tensor):多维数组(列表) 阶:张量的维数 ···维数···...

2018-08-20 18:22:09

阅读数 8140

评论数 0

TensorFlow笔记-02-使用PyCharm搭建TensorFlow环境(win版非虚拟机)

Windows下TensorFlow环境的搭建(非虚拟机) 本篇介绍的是在windows系统下,使用Anaconda+PyCharm,不使用虚拟机安装Linux 安装Anaconda 这个相信有很多人都在用,所以简单说一下 如果没有安装可以直接去Anaconda官网下载:https://w...

2018-08-20 12:14:47

阅读数 10782

评论数 0

提示
确定要删除当前文章?
取消 删除