java dataframe是什么,让我们一起了解一下。
DataFrame是二维的表格型数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),很多功能与R中的data.frame类似,可以将DataFrame理解为Series的容器。
DataFrame创建方式有哪些?
1、二维数组结构(列表,ndarray数组,DataFrame等)类型。
2、字典类型,key为列名,value为一维数组结构(列表,ndarray数组,Series等)。
3、如果没有显式指定行与列索引,则会自动生成以0开始的整数值索引。我们可以在创建DataFrame对象时,通过index与columns参数指定。
4、可以通过head(n),tail(n)访问前 / 后n行记录(数据)。
5、通过sample(n) 随机抽取n行。
6、df.index.name = "index_name" ,指定行索引名称,df.columns.name = "columns_name" ,指定列索引名称。
DataFrame的基本属性和方法是什么?
DataFrame的基本属性:
(1)dataframe.shape #元组,返回dataframe形状 如(1000,10)即1000行10列。 (2)dataframe.head(3)#新DataFrame,获取前三行,默认获取前五行。 (3)dataframe.tail(3)#新DataFrame,获取后三行,默认获取后五行。 (4)dataframe.index #获取DataFrame的index。 (5)dataframe.columns #获取columns,DataFrame的列索引列表。 (6)dataframe.values #获取values,获取所有values。 (7)dataframe.info #获取dataframe的信息。 (8)dataframe.describe #dataframe统计性描述。 (9)dataframe.dtypes #查看dataframe所有列的数据类型。
DataFrame的方法:
(1)dataframe.T #转置,新DataFrame,行列互换。 (2)data.index = list #设置index,新DataFrame按照list的数据内容修改index,必须整体全部修改。 (3)df.reset_index(drop=False) #重设新的下标索引,新DataFrame,drop:默认为False,不删除原来索引,如果为True,删除原来的索引值。 (4)df.set_index(keys, drop=True) #把某列值设置为新的索引,keys : 列索引名成或者列索引名称的列表;drop: 默认为False,不删除原来索引,如果为True,删除原来的索引值。 (5)dataframe[‘A’].astype(np.float32) #修改数据类型。
以上就是小编今天的分享了,希望可以帮助到大家。