java dataframe

作者:原创时间:2022-03-29
文档

java dataframe是什么,让我们一起了解一下。

DataFrame是二维的表格型数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),很多功能与R中的data.frame类似,可以将DataFrame理解为Series的容器。 

DataFrame创建方式有哪些?

1、二维数组结构(列表,ndarray数组,DataFrame等)类型。

2、字典类型,key为列名,value为一维数组结构(列表,ndarray数组,Series等)。

3、如果没有显式指定行与列索引,则会自动生成以0开始的整数值索引。我们可以在创建DataFrame对象时,通过index与columns参数指定。

4、可以通过head(n),tail(n)访问前 / 后n行记录(数据)。

5、通过sample(n) 随机抽取n行。

6、df.index.name = "index_name"  ,指定行索引名称,df.columns.name = "columns_name" ,指定列索引名称。

DataFrame的基本属性和方法是什么?

DataFrame的基本属性:

(1)dataframe.shape     #元组,返回dataframe形状 如(1000,10)即1000行10列。
(2)dataframe.head(3)#新DataFrame,获取前三行,默认获取前五行。
(3)dataframe.tail(3)#新DataFrame,获取后三行,默认获取后五行。
(4)dataframe.index     #获取DataFrame的index。
(5)dataframe.columns   #获取columns,DataFrame的列索引列表。
(6)dataframe.values    #获取values,获取所有values。
(7)dataframe.info      #获取dataframe的信息。
(8)dataframe.describe  #dataframe统计性描述。
(9)dataframe.dtypes    #查看dataframe所有列的数据类型。

DataFrame的方法:

(1)dataframe.T                  #转置,新DataFrame,行列互换。
(2)data.index = list   #设置index,新DataFrame按照list的数据内容修改index,必须整体全部修改。
(3)df.reset_index(drop=False)     #重设新的下标索引,新DataFrame,drop:默认为False,不删除原来索引,如果为True,删除原来的索引值。
(4)df.set_index(keys, drop=True)  #把某列值设置为新的索引,keys : 列索引名成或者列索引名称的列表;drop: 默认为False,不删除原来索引,如果为True,删除原来的索引值。
(5)dataframe[‘A’].astype(np.float32)  #修改数据类型。

以上就是小编今天的分享了,希望可以帮助到大家。

显示全文
java规则引擎 java dataset java读取json java读取本地excel java decaf java调python java decode java decodeuri java delegate java调用c++接口 java调用c++ java获取绝对值 java delete java调用asmx接口 java dependency java dev java fastdfs java development java dict java fastjson java表单校验 java获得当前路径 java dashboard java获取随机数 java daemon java获取随机字符串 java ctp java获取运行时间 java cssbox java获取路径 java获取请求域名 java csrf java获取视频时长 java crontab java获取网络时间 java crash java获取秒级时间戳 java core java获取泛型class java corba