博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
bs4取数
阅读量:5768 次
发布时间:2019-06-18

本文共 1673 字,大约阅读时间需要 5 分钟。

# -*- coding: utf-8 -*- from bs4 import BeautifulSoup def file2soup(ffile):     with open(ffile,'r+b') as f:         f.encoding='utf-8'         soup=BeautifulSoup(f,'lxml')         # print (soup)         return soup     pass # def soup2list(soup,ulist): #     # print (soup.div) #     for i in soup.find('tbody').children: #         if isinstance(i,bs4.element.Tag): #             o=i('td') #             ulist.append([o[0].string,o[1].string,o[3].string]) #     return ulist # def soup2list(soup,ulist): #     # print (soup.div) #     for i in soup.find('tbody').children: #         if len(i)>1:#去空行 #             o=i('td')#取出td标签  "td"加引号 o:
!!! # a,b,c=0,1,3 # ulist.append([o[a].string,o[b].string,o[c].string]) # return ulist def soup2list(soup,ulist): i=soup.find('tbody',id="hidden_zhpm") # print (len(i)) print (i) url = 'http://bj.58.com/pinpaigongyu/pn/{ppp}/?minprice=2000_4000' ffile='d://best.txt' ulist=[] soup=file2soup(ffile) ulist=soup2list(soup,ulist) # print (ulist) # print ('{:0>3}\t {:+<15}\t {: >5}\t'.format('排名','校名','总分')) # for i in range(11): # u=ulist[i] # #{:起头+一个填充符+对齐方式+字符长度} # print ('{:0>3}\t {:+<15}\t {: >5}\t'.format(u[0], u[1], u[2] )) --------------------
x=soup.select('.hidden_zhpm')[0] cc=6 list=[] for i in x:     if len(i)>1 and cc>0:         cc-=1         ii=i('td')         list.append([ii[0].string,ii[2].string,ii[3].string]) # print (list) # print ('{} {} {}'.format(list[0][0],list[0][1],list[0][2])) for i in range(11):     print (list[i][0],list[i][1],list[i][2]) # print (type(list[0])) # print (list)

转载于:https://www.cnblogs.com/e35t/p/7040051.html

你可能感兴趣的文章
excel进行矩阵计算
查看>>
基于Android平台的动态生成控件和动态改变控件位置的方法
查看>>
linux 死机分析
查看>>
BOM
查看>>
iOS: Block的循环引用
查看>>
css详解1
查看>>
MySQL类型转换
查看>>
HashSet HashMap 源码阅读笔记
查看>>
变量声明提升1
查看>>
随笔2013/2/19
查看>>
Windows Phone的Silverlight Toolkit 安装及其使用
查看>>
DBS:同学录
查看>>
Mysql备份系列(1)--备份方案总结性梳理
查看>>
[CareerCup] 1.6 Rotate Image 翻转图像
查看>>
Python中的画图初体验
查看>>
Java程序员的日常 —— 响应式导航Demo
查看>>
objective-c内存管理基础
查看>>
sap关于价值串的说法(转载)
查看>>
Migration to S/4HANA
查看>>
sed 对目录进行操作
查看>>