python中pandas的运用，类别数量判断输出？_Python

2条回答

2楼 · 2020-09-18 10:17

Pandas是基于NumPy的一种工具，支持大部分的Numpy语言风格的数组计算，尤其是数组函数以及没有for循环的各种数据处理。尽管Pandas采用了很多Numpy的代码风格，但最大的不同在于Pandas是用来处理表格型或异质型数据的，而Numpy更适合处理同质型的数值类数组数据。

Pandas所包含的数据结构和数据处理工具的设计，使得数据清洗和分析非常快捷，并经常和其他Numpy、Scipy数值计算工具、数据可视化工具Matplotlib结合起来使用，其中大量库和一些标准的数据模型、函数和方法，支持着大型数据集的高效处理。

Pandas常用的数据结构：Series和DataFrame。

importpandasaspd

frompandasimportSeries,DataFrame

一、Series

Series是一种以为的数组型对象，它包含了一个值序列（与Numpy中的类型相似），并且包含了数据标签，成为索引（index）。Series可以运用ndarray或字典的几乎所有索引操作和函数，融合了字典和ndarray的优点。

1、Series创建索引序列

（1）数组自动索引

importpandasaspd

importnumpyasnp

a=pd.Series([9,8,7,6])

Out[17]:

dtype:int64

（2）自定义索引

importpandasaspd

importnumpyasnp

b=pd.Series([9,8,7,6],index=['a','b','c','d'])

Out[18]:

dtype:int64

（3）固定值创建

importpandasaspd

importnumpyasnp

c=pd.Series(25,index=['a','b','c','d'])

Out[19]:

a25

b25

c25

d25

dtype:int64

（4）从字典类型创建，键值对中的键是索引

importpandasaspd

importnumpyasnp

d=pd.Series({'a':9,'b':8,'c':7,'d':6})

Out[20]:

dtype:int64

e=pd.Series({'a':9,'b':8,'c':7,'d':6},index=['a','b','c','d','e'])

Out[21]:

a9.0

b8.0

c7.0

d6.0

eNaN

dtype:float64

（5）从ndarray类型创建

importpandasaspd

importnumpyasnp

f=pd.Series(np.arange(5))

g=pd.Series(np.arange(5),index=np.arange(6,1,-1))

print(f)

print(g)

Out[22]:

dtype:int32

注意：Series类型会自动生成默认索引，当自动索引和自定义索引并存，全当自定义索引。

2.Series常用属性

（1）values和index获取Series对象的值和索引

importpandasaspd

importnumpyasnp

b=pd.Series([9,8,7,6],index=['a','b','c','d'])

b.index

Out[29]:Index(['a','b','c','d'],dtype='object')

b.values

Out[30]:array([9,8,7,6],dtype=int64)

b[1]

Out[31]:8

b['b']

Out[32]:8

b[['b','c','d',0]]

Out[33]:

b8.0

c7.0

d6.0

0NaN

dtype:float64

（2）对象的值的name和索引index的name

importpandasaspd

importnumpyasnp

b=pd.Series([9,8,7,6],index=['a','b','c','d'])

b.name

b.name='Series对象'

b.index.name='索引列'

Out[35]:

索引列

Name:Series对象,dtype:int64

（3）支持ndarry的属性，如dtype、shape、ndim、T等，就不一一举例了。下表从官方文档中拉取Series的Attribute，以便查询。

Series.array支持此系列或索引的数据的ExtensionArray。Series.values返回系列为ndarray或ndarray-like取决于dtype。Series.dtype返回基础数据的dtype对象。Series.ftype如果数据稀疏则返回。Series.shape返回基础数据形状的元组。Series.nbytes返回基础数据中的字节数。Series.ndim根据定义1，基础数据的维数。Series.size返回基础数据中的元素数。Series.strides返回基础数据的步幅。Series.itemsize返回基础数据项的dtype大小。Series.base如果共享基础数据的内存，则返回基础对象。Series.T返回转置，根据定义自我。Series.memory_usage([index，deep])返回系列的内存使用情况。Series.hasnans如果我有任何nans，我会回来; 实现各种性能加速。Series.flags Series.empty判断Series是否为空，返回值为布尔类型Series.dtypes返回基础数据的dtype对象。Series.ftypes如果数据稀疏则返回。Series.data返回基础数据的数据指针。Series.is_copy退回副本。Series.name返回系列的名称。Series.put（*args，**kwargs）将put方法应用于其values属性（如果有

3.Series转换函数

Series.astype（dtype[，copy，errors]）将pandas对象转换为指定的dtype dtype。Series.infer_objects（）尝试推断对象列的更好的dtypes。Series.convert_objects（[convert_dates，...]）（DEPRECATED）尝试推断对象列的更好dtype。Series.copy（[deep]）复制此对象的索引和数据。Series.bool（）返回单个元素PandasObject的bool。Series.to_numpy（[dtype，copy]）NumPyndarray表示此系列或索引中的值。Series.to_period（[freq，copy]）将Series从DatetimeIndex转换为具有所需频率的PeriodIndex（如果未传递则从索引推断）。Series.to_timestamp（[freq，how，copy]）在期间开始时转换为时间戳的时间索引。Series.to_list（）返回值列表。Series.get_values（）与值相同（但处理稀疏转换），是一种展示。Series.__array__（[dtype]）将值作为NumPy数组返回。

4.Series索引、迭代函数

Series.get（ket[，default]）从给定键的对象获取项目（DataFrame列，Panel切片等）。Series.at访问行/列标签对的单个值。Series.iat按整数位置访问行/列对的单个值。Series.loc按标签或布尔数组访问一组行和列。Series.iloc纯粹基于整数位置的索引，用于按位置选择。Series.__iter__（）返回值的迭代器。Series.iteritems（）懒惰地迭代（索引，值）元组。Series.items（）懒惰地迭代（索引，值）元组。Series.keys（）索引的别名。Series.pop（item）返回项目并从框架中删除。Series.item（）将基础数据的第一个元素作为python标量返回。Series.xs（key[，axis，level，drop_level]）返回Series/DataFrame的横截面。

5. 二元运算符函数

Series.add（other[，level，fill_value，axis]）添加系列和其他元素（二元运算符添加）。Series.sub（other[，level，fill_value，axis]）减去序列和其他元素（二元运算符子）。Series.mul（other[，level，fill_value，axis]）系列和其他的乘法，元素（二元运算符mul）。Series.div（other[，level，fill_value，axis]）浮动分裂系列和其他，元素方式（二元运算符truediv）。Series.truediv（other[，level，fill_value，axis]）浮动分裂系列和其他，元素方式（二元运算符truediv）。Series.floordiv（other[，level，fill_value，axis]）系列和其他的整数除法，元素方式（二元运算符floordiv）。Series.mod（other[，level，fill_value，axis]）系列和其他的模数，元素方式（二元运算符mod）。Series.pow（other[，level，fill_value，axis]）系列和其他元素的指数幂（二元运算符pow）。Series.radd（other[，level，fill_value，axis]）添加系列和其他元素（二元运算符radd）。Series.rsub（other[，level，fill_value，axis]）系列和其他元素的减法（二元运算符rsub）。Series.rmul（other[，level，fill_va

乔治与佩奇

3楼 · 2021-12-15 16:34

因为是数学专业，最开始深入学习的是MATLAB（下面简称M），感受最深的就是M的简单高效，高精度，不管什么东西，统统放到数组（或者说矩阵）里面，天哪噜，不可思议，和C语言、C++相比，这玩意就是个天生的数据实验室利器。后来用M做了个GUI，在编译成C风格的exe时花了大心血，才发现，原来这厮是个不折不扣的封闭症患者，和其他语言的友好指数基本为0。再后来涉及到版权问题，这才下定决心换个工具——Python。废话少说，快快进入正题，直接上源代码。

这里就先上两种数据类型的基本操作——增删改查。

python中pandas的运用，类别数量判断输出？

相关问题推荐

等你来答

热门问答

相关文章

python中pandas的运用，类别数量判断输出？

相关问题推荐

等你来答

热门问答

相关文章

采纳回答

编辑标签

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

付费偷看金额在0.1-10元之间