BeautifulSoup4总结

发表于2025-07-20|更新于2025-07-22|python

|总字数:129|阅读时长:1分钟|浏览量:

BeautifulSoup4 介绍与安装

Beautiful Soup
从HTML或XML文件中提取数据的Python库(bs4)
Beautiful Soup 4.4.0 文档

安装 Beautiful Soup(且要安装lxml作为解析器)
pip install beautifulsoup4
pip install lxml
源码：Beautiful Soup

BeautifulSoup4 使用

导入 Beautiful Soup 库
from bs4 import BeautifulSoup
import requests
使用 requests 获取网页内容
url = 'https://baidu.com/'
response = requests.get(url)
创建 BeautifulSoup 对象
soup = BeautifulSoup(response.text, 'lxml')
输出结果
print(soup)

from bs4 import BeautifulSoup
import requests

url = 'https://baidu.com/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'lxml')  # 使用 lxml 解析器
print(soup)

文章作者: 微光zc

文章链接: https://wzcwzc10.github.io/2025/07/20/BeautifulSoup4%E6%80%BB%E7%BB%93/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源微光zc的网络小窝！

python 爬虫 BeautifulSoup 总结

来一杯燃油饮

微信
支付宝

相关推荐

python 爬虫初步学习

python 爬虫学习前言爬虫是自动化抓取网页数据的一种技术爬虫的实现原理是：模拟浏览器，向目标网站发送请求获取网页数据，对数据进行解析，保存爬虫的分类：通用爬虫聚焦爬虫学习爬虫不要心急，慢慢来收获会很多。一、Robots协议是什么？Robot协议是国际互联网通行的道德规范，告诉人们那些可以爬，那些不可以爬，但是没有写入法律。二、爬虫的使用步骤1.获取网页基础技术：request，urllib，selenium。进阶技术：多进程多线程抓取，登录抓取，突破IP封禁，服务器抓取。 2.解析数据基础技术：re正则表达式，BeautifulSoup，lxml。进阶技术：解决中文乱码。 3.存储数据基础技术：存入txt文件，存入csv文件，存入json文件。进阶技术：存入SQL数据库。

python 学习第三天

python 学习123456789101112131415161718192021222324252627282930313233343536373839#条件if语句year=int(input("请输入年份:"))day=28if(year%4==0 and year%100!=0)or year%400==0: day=29print("{0}年二月有{1}天".format(year,day))"""if(): elif<>: [else:<>]"""#循环while语句num=0str="student"while num<len(str): if str[num]=='u': break print("循环进行中："+str[num]) num=num+1else: str="...

python 学习第七天

python 学习1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798#图形用户界面#关于Tkinter内置库,Python的标准GUI库,支持win,Linux,UNIX,Macintosh#tk接口是Tk图形用户界面工具包标准的Python接口#图像化编程的基本步骤#导入Tkinter模块#创建GUI根窗口#添加人机交互控件并编写相应的函数#在主事件循环中等待用户触发事件响应import tkintermaster=tkinter.Tk() #创建顶层窗口对象master.title("这是一个窗口")master.geometry("300x120")master.mainloop() ...

评论