博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Selenium的简单使用
阅读量:5300 次
发布时间:2019-06-14

本文共 1055 字,大约阅读时间需要 3 分钟。

selenium的使用对于新手来说十分友好,因为他避开了如今网络中的异步加载抓取的困扰,使得我们大部分的时间可以用于提取信息和存储中,下面就简单的列一些使用的代码,希望给同样初学的你有一定的参考价值。

#!/usr/bin/env python# -*- coding: utf-8 -*-__author__ = 'Lix'from selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsfrom selenium.webdriver.common.by import Byimport timedef selenium_example():    site_url = 'https://i.cnblogs.com/EditPosts.aspx?opt=1'    driver = webdriver.Chrome()    driver.get(site_url)    time.sleep(3)    content = driver.page_source.encode('utf-8')    print driver.title    print contentdef main():    selenium_example()if __name__ == "__main__":    main()

这里的话你可以替换着找一些合适的网站试一下,运行的时候会自动弹出测试的浏览器(这里是谷歌浏览器),不是电脑或者其他与原因,请不要紧张。

 

接下来是如何利用selenium获取数据

定位元素

find_elements_by_namefind_elements_by_xpathfind_elements_by_link_textfind_elements_by_partial_link_textfind_elements_by_tag_namefind_elements_by_class_namefind_elements_by_css_selector

举例

username = driver.find_element_by_name('username')password = driver.find_element_by_name('password')

 

转载于:https://www.cnblogs.com/xingnie/p/9824164.html

你可能感兴趣的文章
HDU-3666 THE MATRIX PROBLEM
查看>>
鼠标悬停放大图片 - 漂亮
查看>>
【转载】博士后了
查看>>
IDEA操作git的一些常用技巧
查看>>
Java多线程基础(一)
查看>>
TCP粘包拆包问题
查看>>
JAVA学习之开发环境配置
查看>>
Java中Runnable和Thread的区别
查看>>
C#通过webbrowser控件与javascript交互
查看>>
mongodb 的安装(Centor OS )
查看>>
设计模式之迭代器模式
查看>>
Android高效加载大图、多图解决方案,有效避免程序OOM
查看>>
git操作
查看>>
css常识
查看>>
css浮动
查看>>
golang字符串常用系统函数
查看>>
SQL Server中利用正则表达式替换字符串
查看>>
POJ 1015 Jury Compromise(双塔dp)
查看>>
hrbustOJ 1373Leyni, LOLI and Leaders(图论)
查看>>
[QT_QML]qml假如调试信息 qDebug console.debug
查看>>