python提取指定行和列的数据_python提取某一行数据

2025-01-13 10:12 生活资讯

Python处理Excel效率高十倍(下篇)通篇硬干货，再也不用加班啦

print(df[(df.语文==99) |(df.英语==99)])

《用Python处理Excel表格》下篇来啦！

python提取指定行和列的数据_python提取某一行数据

身为工作或学生的你，平日里肯定少不了与Excel表格打交道的机会。当你用Excel处理较多数据时，还在使用最原始的人工作吗？现在教你如何用Python处理Excel，从此处理表格再也不加班，时间缩短数十倍！

上篇我们进行了一些事前准备，目的是用Python提取Excel表中的数据。而这一篇便是在获取数据的基础上，对Excel表格的实处理。

第9行代码用来指定创建的excel的活动表的名字：

·不写第9行，默认创建sheet

·写了第9行，创建指定名字的sheet表

第9行代码，通过给单元格重新赋值，来修改单元格的值

第9行代码的另一种写法sheet['B1'].value = 'age'

第10行代码，保存时如果使用原来的（第7行）名字，就直接保存；如果使用了别的名字，就会另存为一个新文件

插入有效数据

使用append()方法，在原来数据的后面，按行插入数据

·insert_rows(idx=数字编号, amount=要插入的行数)，插入的行数是在idx行数的下方插入

·insert_cols(idx=数字编号, amount=1 2 070102 陈冠涛 07 0701 89 89 89 267 及格要插入的列数)，插入的位置是在idx列数的左侧插入

·delete_rows(idx=数字编号, amount=要删除的行数)

·delete_cols(idx=数字编号, amount=要删除的列数)

举个例子：

openpyxl.styles.Font(name=字体名称,size=字体大小,bold=是否加粗,italic=是否斜体,color=字体颜色)

其中，字体颜色中的color是RGB的16进制表示

再者，可以使用for循环，修改多行多列的数据，在这里介绍了获取的方法

Alignment(horizontal=水平对齐模式,vertical=垂直对齐模式,text_rotation=旋转角度,wrap_text=是否自动换行)

水平对齐：‘distributed’，‘justify’，‘center’，‘left’， ‘centerContinuous’，'right，‘general’

垂直对齐：‘bottom’，‘distributed’，‘justify’，‘center’，‘top’

设置行列的宽高：

·row_dimensions[行编号].height = 行高

·column_dimensions[列编号].width = 列宽

合并单元格有下面两种方法，需要注意的是，如果要合并的格子中有数据，即便python没有报错，Excel打开的时候也会报错。

merge_cells(待合并的格子编号)

merge_cells(start_row=起始行号，start_column=起始列号，end_row=结束行号，end_column=结束列号)

拆分单元格的方法同上

unmerge_cells(待合并的格子编号)

create_sheet(“新的sheet名”)：创建一个新的sheet表

第11行，使用title修改sheet表的名字

remove(“sheet名”)：删除某个sheet表

要删除某sheet表，需要激活这个sheet表，即：将其作为活动表（关于活动表的定义请看前面文章开头写的有）下面8~11行代码展示了原始活动表与手动更换活动表，第13行代码删掉活动表

背景知识

numpy与pandas

NumPy是 Python 语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库；pandas 是基于NumPy 的一种工具，该工具是为解决数据分析任务而创建的，我们需要利用Pandas进行Excel的合并

1.下面的代码生成了一个5行3列的包含15个字符的嵌套列表

（注意，第4行代码：15是等于35的，如果是15对应43，或者16对应53都会报错）

（注意，第5行代码，虽然5行3列是15个数据，但是可以指定数据从1开头，到16结束）

2.添加表头

使用pandas库的DataFrame来添加表头。关于打印的结果，把最左侧的一列去掉之后会发现结果很和谐，这是因为最左侧的一列代表行号。此时xx变量的类型是

xlsxwriter模块一般是和xlrd模块搭配使用的，

xlsxwriter：负责写入数据，

xlrd：负责读取数据。

1.创建一个工作簿

2.创建sheet表

3.写入数据

用python读取一个文件夹下的所有CSV文件里某一列数据中值，将此值所在行截取到新CSV文件中？

from pandas import read_excel

以下代码可实现你的要求，我有两个csv文件，其中第7列是“实际入库数量”，你只需要修改下面两个代码就可以用了：

1、第15行的7，这是“实际入库数量”的列数

2、第17行的“实际入库数量”，这是列0 1 070101 王博宇 NaN NaN 84 71 93 NaN NaN名

这是csv数据的样式，列数是基于0开始的

python如何读取csv某列XX行数据保存为列表？

数据表清洗

list1 = df[[df.columns[2],df.columns[0]]]

list2 = df[[df.columns[2],df.columns# coding=gbk[1]]]

怎么用python读取txt文件里指定行的内容，并导入excel

如果文件不大，建议使用下面的方法。由于linecache会缓存，所以对大文件可以使用自己简单是实现getline如下：

if desired_line_number < 1: return ''

for current_line_number, lin14 memory usage: 368.0 bytese in enumerate(open(thefilepath, 'rU')):

if current_line_number == desired_line_number - 1 : return line

r89 3eturn ''

怎么用python读取txt文件里指定行的内容，并导入excel

6 ‘pr’:[1200,np.nan,2133,5433,np.nan,4432]},1 #数据表信息

如果文件不大，建议使用下面的方法。由于linecache会缓存，所以对大文件可以使用自己简单是实现getline如下：

if desired_line_number < 1: return ''

for current_line_number, line in enumerate(open(thefilepath, 'rU')):

if current_line_number == desired_line_number - 1 : return line

return ''

如何在python中使用正则表达式提取每行中需要的信息

与数据分析相关的Python库很多，比如Numpy、pandas、matplotlib、scipy等，数据分析的作包括数据的导入和导出、数据筛选、数据描述、数据处理、统计分析、可视化等等。接下来我们看一下如何利用Python完成数据的分析。

import re

file_object = open('temp.txt')

try:

str = file_object.read( )

finally:

file_object.close( )

result = re.findall("(d+%) Ss+d+ (d+)Ks+(d+)K",str)

f = open("test.csv","w")

for line in result:

f.write("%s,%s,%s

"%(line[0],line[1],输出结果如下：line[2]))

f.close()

python中如何将表中的数据做成一张表,然后再从中取出数据？

部分是生成数据表，常见的生成方法有两种，种是导入外部数据，第二种是直接写入数据。 Excel 中的文件菜单中提供了获取外部数据的功能，支持数据库和文本文件和页面的多种数据源导入。

获取外部数据

python 支持从多种类型的数据导入。在开始使用 python 进行数据导入前需要先导入 pandas 库，为了方便起见，我们也同时导入 numpy 库。

1 import numpy as np

2 import pandas as pd

导入数据表

下面分别是从 excel 和 csv 格式文件导入数据并创建数据表的方法。代码是最简模式，里面有很多可选参数设置，例如列名称，索引列，数据格式等等。感兴趣的朋友可以参考 pandas 的

文档。

1 df=pd.DataFrame(pd.read_csv(‘name.csv’,header=1))

2 df=pd.DataFrame(pd.read_excel(‘name.xlsx’))

创建数据表

另一种方法是通过直接写入数据来生成数据表，excel 中直接在单元格中输入数据就可以，python 中通过下面的代码来实现。生成数据表的函数是 pandas 库中的 DateFrame 函数，数据表一共有 6 行数据，每行有 6 个字段。在数据中我们特意设置了一些 NA 值和有问题的字段，例如包含空格等。后面将在数据清洗步骤进行处理。后面我们将统一以 DataFrame 的简称 df 来命名数据表。

1 df = pd.DataFrame({‘id’:[1001,1002,1003,1004,1005,1006],

2 ‘date’:pd.date_range(‘20130102’, periods=6),

3 ‘city’:['Beijing ', ‘SH’, ’ guangzhou ', ‘Shenzhen’, ‘shanghai’, 'BEIJING '],

4 ‘age’:[23,44,54,32,34,32],

5 ‘category’:[‘100-A’,‘100-B’,‘110-A’,‘110-C’,‘210-A’,‘130-F’],

7 columns =[‘id’,‘date’,‘city’,‘category’,‘age’,‘pr’])

这是刚刚创建的数据表，我们没有设置索引列，pr 字段中包含有 NA 值，city 字段中还包含了一些数据。

数据表检查

python 中处理的数据量通常会比较大，所以就需要我们对数据表进行检查。比如我们之前的文章中介绍的纽约出租车数据和 Citibike 的骑行数据，数据量都在千万级，我们无法一目了然的了解数据表的整体情况，必须要通过一些方法来获得数据表的关键信息。数据表检查的另一个目的是了解数据的概况，例如整个数据表的大小，所占空间，数据格式，是否有空值和重复项和具体的数据内容。为后面的清洗和预处理做好准备。

数据维度(行列)

Excel 中可以通过 CTRL 向下的光标键，和 CTRL 向右的光标键来查看行号和列号。Python 中使用 shape 函数来查看数据表的维度，也就是行数和列数，函数返回的结果(6,6)表示数据表有 6 行，6 列。下面是具体的代码。

1 #查看数据表的维度

2 df.shape

3 (6, 6)

数据表信息

使用函数查看数据表的整体信息，这里返回的信息比较多，包括数据维度，列名称，数据格式和所占空间等信息。

2 df.()

5 RangeIndex: 6 entries, 0 to 5

6 Data columns (total 6 columns):

7 id 6 non-null int64

8 date 6 non-null datetime64[ns]

9 city 6 non-null object

10 category 6 non-null object

11 age 6 non-null int64

12 pr 4 non-null float64

13 dtypes: datetime64ns, float64(1), int64(2), object(2)

查看数据格式

Excel 中通过选中单元格并查看开始菜单中的数值类型来判断数据的格式。Python 中使用 dtypes 函数来返回数据格式。

Dtypes 是一个查看数据格式的函数，可以一次性查看数据表中所有数据的格式，也可以指定一列来单独查看。

1#查看数据表各列格式

2df.dtypes

34id int64

5date datetime64[ns]

6city object

7category object

9pr float64

10dtype: object

13df[‘B’].dtype

15dtype(‘int了解Python流程控制——条件、循环语句与其他语句64’)

查看空值

Excel 中查看空值的方法是使用“定位条件”功能对数据表中的空值进行定位。“定位条件”在“开始”目录下的“查找和选择”目录中。

Isnull 是 Python 中检验空值的函数，返回的结果是逻辑值，包含空值返回 True，不包含则返回 False。可以对整个数据表进行检查，也可以单独对某一列进行空值检查。

df_isnull

1#检查特定列空值

2df[‘pr’].isnull()

340 False

51 True

62 False

73 False

84 True

95 False

10Name: pr, dtype: bool

查看值

Excel 中查看值的方法是使用“条件格式”对值进行颜色标记。Python 中使用 unique 函数查看值。

Unique 是查看值的函数，只能对数据表中的特定列进行检查。下面是代码，返回的结果是该列中的值。类似与 Excel 中删除重复项后的结果。

1 #查看 city 列中的值

2 df[‘city’].unique()34array(['Beijing ', ‘SH’, ’ guangzhou ', ‘Shenzhen’, ‘shanghai’, 'BEIJING '], dtype=object)

查看数据表数值

Python 中的 Values 函数用来查看数据表中的数值。以数组的形式返回，不包含表头信息。

1#查看数据表的值

2df.values

34array([[1001, Timestamp(‘2013-01-02 00:00:00’), 'Beijing ', ‘100-A’, 23,

5 1200.0],

6 [1002, Timestamp(‘2013-01-03 00:00:00’), ‘SH’, ‘100-B’, 44, nan],

7 [1003, Timestamp(‘2013-01-04 00:00:00’), ’ guangzhou ', ‘110-A’, 54,

8 2133.0],

9 [1004, Timestamp(‘2013-01-05 00:00:00’), ‘Shenzhen’, ‘110-C’, 32,

10 5433.0],

11 [1005, Timestamp(‘2013-01-06 00:00:00’), ‘shanghai’, ‘210-A’, 34,

12 nan],

14 4432.0]], dtype=object)

查看列名称

Colums 函数用来单独查看数据表中的列名称。

1 #查看列名称

2 df.columns

34 Index([‘id’, ‘date’....., ‘city’, ‘category’, ‘age’, ‘pr’], dtype=‘object’)

查看前 10 行数据

Head 函数用来查看数据表中的前 N 行数据，默认 head()显示前 10 行数据，可以自己设置参数值来确定查看的行数。下面的代码中设置查看前 3 行的数据。

Tail 行数与 head 函数相反，用来查看数据表中后 N 行的数据，默认 tail()显示后 10 行数据，可以自己设置参数值来确定查看的行数。下面的代码中设置查看后 3 行的数据。

1#查看 3 行df.tail(3)

Python处理Excel效率高十倍(下篇)通篇硬干货，再也不用加班啦

8age int64

《用Python处理Excel表格》下篇来啦！

上篇我们进行了一些事前准备，目的是用Python提取Excel表中的数据。而这一篇便是在获取数据的基础上，对Excel表格的实处理。

第9行代码用来指定创建的excel的活动表的名字：

·不写第9行，默认创建sheet

·写了第9行，创建指定名字的sheet表

第9行代码，通过给单元格重新赋值，来修改单元格的值

第9行代码的另一种写法sheet['B1'].value = 'age'

第10行代码，保存时如果使用原来的（第7行）名字，就直接保存；如果使用了别的名字，就会另存为一个新文件

插入有效数据

使用append()方法，在原来数据的后面，按行插入数据

·insert_rows(idx=数字编号, amount=要插入的行数)，插入的行数是在idx行数的下方插入

·insert_cols(idx=数字编号, amount=要插入的列数)，插入的位置是在idx列数的左侧插入

·delete_rows(idx=数字编号, amount=要删除的行数)

·delete_cols(idx=数字编号, amount=要删除的列数)

举个例子：

openpyxl.styles.Font(name=字体名称,size=字体大小,bold=是否加粗,italic=是否斜体,color=字体颜色)

其中，字体颜色中的color是RGB的16进制表示

再者，可以使用for循环，修改多行多列的数据，在这里介绍了获取的方法

Alignment(horizontal=水平对齐模式,vertical=垂直对齐模式,text_rotation=旋转角度,wrap_text=是否自动换行)

水平对齐：‘distributed’，‘justify’，‘center’，‘left’， ‘centerContinuous’，'right，‘general’

垂直对齐：‘bottom’，‘distributed’，‘justify’，‘center’，‘top’

设置行列的宽高：

·row_dimensions[行编号].height = 行高

·column_dimensions[列编号].width = 列宽

合并单元格有下面两种方法，需要注意的是，如果要合并的格子中有数据，即便python没有报错，Excel打开的时候也会报错。

merge_cells(待合并的格子编号)

merge_cells(start_row=起始行号，start_column=起始列号，end_row=结束行号，end_column=结束列号)

拆分单元格的方法同上

unmerge_cells(待合并的格子编号)

create_sheet(“新的sheet名”)：创建一个新的sheet表

第11行，使用title修改sheet表的名字

remove(“sheet名”)：删除某个sheet表

背景知识

numpy与pandas

1.下面的代码生成了一个5行3列的包含15个字符的嵌套列表

（注意，第4行代码：15是等于35的，如果是15对应43，或者16对应53都会报错）

（注意，第5行代码，虽然5行3列是15个数据，但是可以指定数据从1开头，到16结束）

2.添加表头

xlsxwriter模块一般是和xlrd模块搭配使用的，

xlsxwriter：负责写入数据，

xlrd：负责读取数据。

1.创建一个工作簿

2.创建sheet表

3.写入def getline(thefilepath, desired_line_number):数据

用python对部分数据分析，读取其中一列并且按照取值范围选取一部分？

move_range(“数据区域”,rows=,cols=)：正整数为向下或向右、负整数为向左或向上

for line in f:

df['总分']=df['语文']+df['数学']+df['英语']if 0

data=float(line.split()[2])

print(data)

用python读取一个文件夹下的所有CSV文件里某一列数据中值，将此值所在行截取到新CSV文件中？

total=你要提取的行的行号

以下代码可实现你的要求，我有两个csv文件，其中第7列是“实际入库数量”，你只需要修改下面两个代码就可以用了：

1、第15行的7，这是“实际入库数量”的列数

2、第17行的“实际入库数量”，这是列名

这是csv数据的样式，列数是基于0开始的unmerge_cells(start_row=起始行号，start_column=起始列号，end_row=结束行号，end_column=结束列号)

在python中的多行列表中，如何取自己想要的行数

当然，你仍旧可以调用for循环来实现对多行多列的作

设你的原来矩阵为x,新的1#查看前 3 行数据``df.head(``3``)矩阵是y

y[:,0:n-m]=x[:,m:n]表示取x第m到n-1列数据,赋给y的前n-m列。

同理y[0:n-m,:]=x[m:n,:]表示取第m到n-1行数据，赋给y的前n-m行。

声明：本站所有文章资源内容，如无特殊说明或标注，均为采集网络资源。如若本站内容侵犯了原著者的合法权益，可联系 836084111@qq.com 删除。

python提取指定行和列的数据_python提取某一行数据

Python处理Excel效率高十倍(下篇)通篇硬干货，再也不用加班啦

用python读取一个文件夹下的所有CSV文件里某一列数据中值，将此值所在行截取到新CSV文件中？

python如何读取csv某列XX行数据保存为列表？

怎么用python读取txt文件里指定行的内容，并导入excel

怎么用python读取txt文件里指定行的内容，并导入excel

如何在python中使用正则表达式提取每行中需要的信息

python中如何将表中的数据做成一张表,然后再从中取出数据？

Python处理Excel效率高十倍(下篇)通篇硬干货，再也不用加班啦

用python对部分数据分析，读取其中一列并且按照取值范围选取一部分？

用python读取一个文件夹下的所有CSV文件里某一列数据中值，将此值所在行截取到新CSV文件中？

在python中的多行列表中，如何取自己想要的行数

相关文章

热门

推荐

随机